被一支笔硬控不止30秒!大模型时代的学生辅导“全能选手”

从查词翻译到全科家教,有道词典笔X7治好了家长的辅导焦虑。作者 |  程茜
编辑 |  漠影

从风靡90年代的逐个字母输入学习单词的文曲星,到把书本电子化哪里不会点哪里的点读笔,再到即扫即学加载了图像识别能力的词典笔,家庭中的教育硬件形态正在被一次次重塑。但你以为这就是词典笔的终极形态了吗?

如今,在大模型的加持下,词典笔的能力正一次次被刷新。就在本月初,有道词典笔X7全新亮相,让我们真正看到了大模型时代词典笔的样子。

▲有道词典笔X7

伴随着大模型能力升级,词典笔的能力已经从最初的中英文互译工具,成长为可以让学生随身携带的全科家教。有道词典笔X7基于子曰教育大模型搭载了两大AI原生应用,分别是AI全科家庭教师有道小P、虚拟人口语私教Hi Echo,可以帮助学生解答各个科目的难题,并化身一对一私教随时陪伴练习口语。与此同时,词典笔与用户的交互体验发生了质的改变,从简单的扫描扩展至拍照识别、语音交互,因此在识别、理解用户提问意图的能力方面也更上一层楼。

值得注意的是,随着大模型应用落地开花,教育智能硬件赛道异军突起,成为众多玩家布局的重要赛道,有道词典笔X7正是其中里程碑式的硬件革新。实际上,从去年8月至今,有道已经陆续推出多款词典笔,将大模型与这一教育硬件品类的连结变得愈加紧密。

在此背景下,智东西深度体验了有道最新的词典笔X7,并与有道词典笔产品负责人孟旭进行了深入交流,剖析有道对大模型时代词典笔的全新定义。


01.大模型时代的词典笔长啥样?AI摄像头秒速上传长篇文言文


我拿到有道词典笔X7的第一感受就是,体积小、携带轻便且周身按键并不多。

先从硬件来看,除了词典笔经典的笔头扫描区,X7只有两个按钮,一个是电源键,另一个是语音唤醒按键。X7背面搭载的AI摄像头,主要负责需要拍照识别的功能。

我可以直观感受到,X7的笔头扫描区相比此前看到的词典笔都更宽一些。据孟旭透露,目前,有道词典笔X7的笔头扫描区域宽度已经达到2cm,这是业界千元机中笔头宽度最大的产品。这背后的难点在于要兼顾笔头扫描面积与扫描速度、识别效果、预防跌落损坏等各方面的考量,需要研发人员进行系统化的研发迭代。

为了试试这个“宽笔头”好不好用,我特意用各种不同的速度和角度扫描试了试,发现X7在扫描同时屏幕上会同步出现相应的句子,即便快速用笔划过纸面,扫描的结果也不会有很大出入。扫描完成后,我可以点击句子或段落中的对应单词和短语查看更为详细的翻译与用法等。

在学生时代,尤其搜索题目寻找解题思路时,我最头疼的就是包含大量几何图形以及数学符号的数学题,想要通过键盘输入十分困难,但现在,我打开有道词典笔X7的AI拍照功能,就可以拍摄各种题目上传获取解题思路。

除了数学题,长篇幅的文言文也是如此,直接拍照识别是比较简单的上传方式,我可以通过语音交互直接提出自己的具体疑问,把更多的时间放到了解答疑问、学习知识上。可以看出,伴随着软硬件升级迭代,词典笔使用场景的天花板正在不断被突破,用户的使用逻辑也在发生改变。大模型能力的跃升与硬件能力的升级迭代,正在让能扫、能拍、能交互的有道词典笔在大模型教育硬件赛道的显著优势逐渐明晰。

02.一支“笔”成私人全科家教帮我精讲难题、1v1口语实训


事实上,我对词典笔最初的印象仍然停留在查词、翻译,而这次有道词典笔X7基于子曰教育大模型内置的AI全科家庭教师小P老师却被定位成了全科家教。

全科家教,不仅要求老师能熟知语文、数学、英语、物理、化学、生物、历史、地理等各个科目,还需要应对各个年龄段学生的问题,现在一支小小的词典笔就能做到吗?

先来看下小P老师应对三门主课的能力。基于上面的AI拍照功能,文章上传过程十分顺利。

小P老师识别成功后,我就可以自由语音提问了,就像真正在课堂上和老师一问一答。我上传分析的文言文是学生时代的必学文章《马说》。这篇文言文中有不少如今很少使用的通假字,例如其中出现了很多个“食”字,并且在不同语境中读音、意思都不同。通假字也是一个重要的考点,因此我询问了小P老师“这篇中有几个通假字”,小P老师不仅提炼了文中的全部通假字,并且没有局限于此,而是针对其涉及到的知识点进行了补充讲解。

语文的问题大多是识别文字,数学题对小P老师的考验就更为严苛了。我特地挑选了一道选项为4个函数图像,且有函数表达式的题目。我直接拍摄对应的题目之后,屏幕上就会自动框选或者进行手动框选找到相应的题目位置进行识别。

攻克数学难题一直是大模型的关键,经常看到诸多在数学表现中十分糟糕的大模型,这让我为小P老师捏了一把冷汗。

解题过程中,小P老师不会直接给出答案,而是先分析题目想考察的重点,再一步步剖析、排除错误的选项,引导我根据现有条件找出最终答案。我还可以在每个步骤的解析后随时打断小P老师,点击右下角的“举手小人”图标我就可以随时提问不理解的解题步骤,如果完全弄明白了就可以勾选旁边的“对号”结束学习过程。

有道词典笔的英语学习技能自然不必多说,在这里就不多加缀叙了。

三门主科之外,物理、化学、生物三门理科也是大模型性能表现的分水岭。我向小P老师问了关于光的问题:“什么是光的干涉和衍射现象。”小P老师会对这一问题通过基本信息的解释、举例、应用等多种方式进行进行详细的解答,还会谈到这一知识点会在哪一年级的教材中涉及到什么考点,妥妥变身为预习神器。

在AI拍照中还有一个“写作指导”功能引起了我的注意,我可以连续上传五张照片以拍全作文进行批改指导。

在结果出来前,我设想过不少小P老师的“批改风格”,但没想到会这么全面。小P老师不仅指出了作文中涉及到的语法错误,还针对其中一些单词给出了推荐的词汇,并对作文的整体进行了评价与分析,与平时老师的风格如出一辙。

作为一名全科私教,小P老师还被我挖掘出了新才能。当我询问“小猫为什么喜欢钻进盒子里”,小P老师就化身“百科全书”,从小猫的习性入手解答疑惑。这个问题看似与学生的学习没有关系,但日常生活中关注到的现象并勇于提问,对于学生保持学习的兴趣、增长眼界很重要。

除了科目问题,进行语言学习和经验积累就需要大量的练习,对于国内的学生而言,因缺少交流的场景很多人都是哑巴英语。虽然现在有很多App、硬件等都提供了虚拟人对话的功能,但据我观察,很少有家长会允许学生随身携带电子设备,并且学生口语训练时最希望的就是能针对自己的薄弱环节进行针对性训练,一般很难找到。

前面提到的X7第二大AI原生应用虚拟人口语私教Hi Echo就是绝佳选择,首先词典笔的体积很小且作为学习工具不会有其他娱乐App,其次我可以根据自己的具体情况自主设置不同的发音、语速、对话阶段、级别,真正实现携带一支笔就能实时进行口语练习。

当选择中级难度,其对应的英语水平就是能进行日常交流但不够流畅,期望的目标是提升流利度,掌握多种情景表达。

页面内还提供了4种虚拟人形象且他们都有自己的独立人设,我还可以选择具体的场景,例如明天有英文面试邀约,就可以和Echo交流先练练手。




03.有道持续领跑词典笔赛道用户洞察+技术积累交出高分答卷


从学习机到词典笔,大模型赋能的教育硬件新品层出不穷。率先将子曰教育大模型落地到学习硬件的有道,已经找到了大模型与教育赛道的有效交集点。

众所周知,词典笔并不是大模型等前沿技术发展带来的新产物。经过数年的发展,词典笔这一教育硬件设备的市场价值已经被证明,成为学生学习过程的必备工具。孟旭谈道,家长、学生等用户对于词典笔的核心需求一直都是能辅助学习,但对于有道而言,如何做到更好地辅助学生学习这件事并没有尽头。

大模型的出现就是很好的印证,其将这一硬件的能力边界向外拓展。她认为,大模型对词典笔这一品类的颠覆性革命主要包含两个方面,这也与当下用户使用词典笔的核心需求一脉相承。

首先是词典笔与用户的交互模式更加自然且理解精准,大模型带来了人机交互体验的跃升,输入方式无需局限于键盘输入、扫描输入等单一、固定模式,同时还能准确理解输入问题并生成相应内容;其次是大模型能满足更个性化、多元的用户需求,基于用户的学习水平、知识储备等进行针对性辅导。

基于此,在家庭教育这一核心需求仍然十分突出的背景下,大模型为词典笔针对性解决这些问题带来了更多想象空间,并反推这一品类的创新升级。

纵观整个大模型产业,去年技术创新飞速进阶,今年基座大模型更新速度逐渐放缓,产业焦点转向真正深入千行百业、为用户真正带来提质增效的应用落地场景。

不过其目前的应用落地仍处于初级阶段,原因在于大模型与不同场景用户核心需求的结合是一个阶段性过程,需要应用端玩家深入洞察用户痛点。

有道作为词典笔领域的开拓者,最早看到了用户在英语学习工具方面的痛点,同时不断从英语学习、双语学习一直到全科学习持续将这一品类的功能向外拓展,这些成为了有道在大模型赋能教育行业中的核心优势及壁垒。在这一过程中,技术方面有道已经构建起有道神经网络翻译、计算机视觉、智能语音、高性能计算四大AI基础能力;内容方面,有道的内容资源非其他玩家可以比拟,X7的词汇量超过7200万,涵盖42个专业领域,支持100多种语言在线翻译,且拥有包括小初高全科全学段的《5·3》独家资源。

虽然我们现在无法看到大模型与词典笔相结合的终极形态,但可以确认的是将技术创新与教育资源整合从而提升学生的学习效率和体验方面,有道已经蹚出了自己的一条路,并瞄准用户的核心需求加速奔跑。正从简单的翻译工具向更全能的家教进阶的有道词典笔X7,就是其中具有里程碑意义的作品。
04.结语:词典笔的AI时代需大模型全方位“武装”


大模型加速走向落地应用,找到产业中的核心场景是重中之重。词典笔一方面已经在解决学生学习需求方面展现出了诸多价值,且自身能力在前沿技术发展下迸发出新的想象空间,使得其成为产业玩家探索AI与教育相结合的重要方向。但归根结底,不论从大模型如何赋能还是硬件产品的性能突破来看,新形态的词典笔是否能真正被市场接受,还在于其是否能真正解决用户的实际问题,那些投机使用AI技术营造卖点或者销售噱头并不能让用户实际感受到产品的价值,只有让大模型真正与用户的细分需求相匹配才是最终的目的。在内容资源与技术研发方面都具有多年研发经验的有道,则走在稳扎稳打的创新路上,正努力让大模型深入人们的学习场景早日变为现实。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)


相关推荐

  • 三星的Galaxy Ring 智能戒指有点意思;附国内外AI产品6月数据
  • 点线面的智慧: 转转JTS技术如何塑造上门履约地理布局
  • 实现LLM应用的可观测,难在哪里?
  • JetBrains IDE全系列采用新的默认“皮肤”:即将面向所有用户提供
  • 谁该有“金融羞耻感”?
  • 5年融资87亿,苏州明星独角兽要IPO了
  • 腾讯和去哪儿网官宣两件大事,上热搜了!
  • CVPR'24 Highlight|一个框架搞定人物动作生成,精细到手部运动
  • ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star
  • 这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试
  • GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了
  • 18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了
  • 微软宣布放弃OpenAI观察员席位,苹果也将搁置,反垄断见效?
  • 全现金!6.65亿美刀!AMD大手一挥收购欧洲最大私人AI实验室
  • DeepMind CEO称AI智力不如猫!LeCun持相同看法!曝光谷歌新项目AI将突破聊天限制
  • 魔改Transformer!9种提速又提效的模型优化方案
  • XGBoost和LightGBM时间序列预测对比
  • AI 正在取代工作岗位、ChatBot 进入厌倦期、向量数据库崛起,人工智能现状报告有这些重要发现!
  • 万字巨制!阿里、百度、腾讯、字节、蚂蚁等 9 大技术专家同台,“卷”出 AI 编码新未来
  • 程序员凭一己之力自研浏览器,挑战Chrome:GitHub联合创始人力挺,投百万美元支持!