▲用户可在菜单面板开启“活力视界”界面
与传统的文字候选栏相比,“活力视界”创新组合了Emoji(表情符号)、花样字、斗图等多样化的候选建议,甚至输入之外的扩展服务,内容展示更加多元。▲“活力视界”为用户提供斗图、Emoji等候选建议
从产品设计的角度来看,赵明路认为,一个好的产品应该用简单的界面为用户提供多维的价值。“活力视界”作为连接传统界面设计和全新AI功能服务之间的线索,通过一个简单的两行视窗,将产品背后丰富的AI能力矩阵呈现在用户面前。对于用户来说,讯飞输入法从交互方式上看起来,可能并没有太大的变化,用户也不需要花费较大的学习成本去理解其中的层级结构。只要用户能更便捷地使用服务,在使用中能感受到“更懂我”,就是讯飞想要达到的效果。▲赵明路解读讯飞输入法13.0的产品创新
程坤告诉智东西,生成式AI输入法的意义和价值,可以从两个层面来理解,也就是智慧表达和智慧连接这两大能力。1、智慧表达:有大脑、有思想、有灵魂的输入法首先,从用户角度来看,生成式AI技术相当于为输入法加上了“大脑”。上一代输入法只能做文字输入,而现在通过生成式AI赋能,输入法不仅能帮助用户把灵感更好地表达出来,还能激发更多创意。智慧表达能力主要分为三个场景,在用户输入的各个时机,即输入前、输入中、输入后,以不同的方式完善用户的表达。一是在输入前智能生成。基于对上下文内容的理解,结合不同表达需求智能生成内容,主动替用户表达。例如,当用户处于聊天、发布、评论、评价等不同场景的输入框时,“活力视界”右端的推荐栏会自动根据场景需求,提供不同的功能。智东西分别选取了朋友圈、微博、淘宝、小红书这四个应用场景体验,讯飞输入法均自动提供了相应风格的文案。▲讯飞输入法在朋友圈、微博、淘宝生成不同风格的文案
同样的,在文案生成后,用户可以通过下方的指令切换不同的风格。例如讯飞输入法生成下面这段小红书文案后,我希望它能提供一个更简短的版本,点击“语言简练点”即可重新生成更符合需求的文案。▲使用讯飞输入法生成小红书文案(动图有加速)
二是在输入中智能补全。基于用户已经输入的内容,讯飞输入法13.0能帮助用户补全句子或续写文章。在补全句子后,用户可以继续在下方选择第二次指令,如引用名言、增加Emoji、改变语气等。▲扩写句子后,用户可点击下方指令为文字增加Emoji
三是在输入后智能润色。基于用户在聊天、评论、发布等不同场景中输入的内容,结合用户表达习惯或需求,对用户的表达进行应情应景的智能润色。▲智能润色后,用户点击下方指令可二次生成不同风格文字
2、智能连接:理解用户意图,以用户为中心连接万物其次,从输入法品类角度来看,生成式AI能够帮助输入法从工具型应用向服务型应用转型,无论是输入法App内还是跨App应用,都能将用户与其输入后想要的服务连接起来。智能连接能力主要体现在连接输入场景内外多元服务上,在不同的场景主动为用户提供不同的功能选择。其中比较具有代表性的功能是AI剪贴板。用户无需输入任何内容,只需复制想要回复的消息,“活力视界”窗口就会自动弹出AI剪贴板功能,并提供智能回复等选项。▲只需复制消息,AI剪贴板就可以提供智能回复
此外,在AI剪贴板中右滑,可以看到拆词、翻译、搜索等更多功能,点击“翻译”即可自动翻译剪贴板中的内容。▲AI剪贴板自动翻译用户剪贴板内容
AI剪贴板提供的翻译功能,也是讯飞输入法智能连接能力的体现——连接输入场景之外的内容与服务,用户无需切换至翻译应用,即可获得文字翻译功能。▲讯飞输入法AI皮肤、AI头像、AI造字界面
除了最基本的生成化特点以外,讯飞认为,新一代输入法认知大模型还应具备个性化、场景化、自进化的特点。在自进化和场景化方面,研发团队结合对比学习,构建了大量正例和负例用于训练Reward Model(奖励模型),并提出了4种Reward Model训练方法,可以在不需要外接人工干预的情况下,实现大模型的常态化自更新。上一代的输入法其实已经具备很多功能,包括不同的输入模式、不同的键位、多种外部功能等。如果对每个功能和项目都进行单独建模,整个系统融合起来的难度是很大的。针对这个问题,讯飞输入法研发团队提出名为ALL-IN-ONE的统一模型架构,利用Prompt(提示词)做任务引导,将不同的任务进行分解耦合训练。除了提高整个系统的稳定性,对可用性、安全性也有很大的提升。▲科大讯飞AI研究院副院长丁克玉解读统一建模与自进化
在个性化方面,面向C端时,大模型的个性化问题一直是业界难题,因为企业无法为每个用户构建一个专属的大模型。对此,讯飞输入法研发团队提出了Low-Rank个性化定制方法,通过将模型尺寸降低到认知大模型的十万分甚至百万分之一,来使小规模的个性化模型能够在手机等移动设备上顺利运行。具体来说,Low-Rank通过使用场景和相关的用户操作记录下来,在端侧训练小模型,既实现了个性化,又保障了用户信息的安全。▲讯飞输入法产品核心指标提升数据
作为一款十几年的“老产品”,尤其是在输入法市场规模增长缓慢的情况下,讯飞输入法能够做到年化10%的活跃用户增幅,离不开团队持续13年对用户需求的深入观察,以及对新兴技术的持续跟进。▲讯飞输入法内容生态总监卢洁解读用户洞察
回顾讯飞输入法13年的发展历程,程坤告诉智东西,有几个特别的节点对讯飞输入法的发展非常关键。首先是2010年,讯飞输入法诞生的日子。当时,这款产品的名字还叫“讯飞语音输入法”,是首款中文语音输入法,它开启了上一代输入法的“语音输入时代”。其次是2012年,讯飞输入法率先将DNN(深度神经网络)应用到语音识别任务中,相对于传统的模型算法使识别效果获得大幅提升,标志着语音输入从“可用”向“好用”发展。2016年,讯飞与锤子手机合作,首次在万人体育场演示语音输入,使语音输入为更多人所知,用户量也获得爆发式增长,月活突破1亿,达到1.1亿规模。2018年作为一个起点,讯飞输入法开始全面拥抱年轻人,先后上线了有趣的、DIY功能、交流社区以及内容开放平台,开始由提升效率向表达个性的方向发展。而如今在2023年,伴随着新生用户的需求增长和大模型时代新技术的赋能,讯飞输入法探索在产品功能、内容生态多方面应用生成式AI技术,想要开启输入法的生成式AI时代。赵明路告诉智东西,如果要用一句话来形容讯飞输入法13.0与12.0相比最大的革新,那就是——全面拥抱生成式AI。赵明路称,用户的需求、技术的发展,始终是讯飞输入法团队不断创新、不断进行产品迭代的最大驱动力。星火大模型提供坚实的技术底座,对用户需求的敏锐洞察提供产品创新的动力,在技术和产品的双向驱动下,讯飞输入法筑起“护城河”,成为输入法品类中的佼佼者。生成式AI输入法不会是终点。在讯飞输入法研发团队看来,它更像是一个分水岭,一个新的发展趋势。程坤谈道,从长远来看,未来,每个人都会有一个智能助理。输入法作为一个既被高频使用,又能跨场景、跨应用的品类,能够连接不同应用之间的“孤岛”,同时又将大模型理解、推理、生成、多模态等优势能力发挥出来。无论是交互界面上的重塑,还是AI功能的增加和深入,都有可能成为继语音输入后,下一个融入每个人生活中难以割舍的用户习惯。(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)