当前位置:主页 > 独家新闻 >
独家新闻
  • 搜狗副总裁吴昊谈论语音翻译硬件。因为有核心
  • 本站编辑:网络中心发布日期:2019-01-27 00:28 浏览次数:
制造商注:本文来自杭州市科技促进局2018年国际创新峰会。中国记者张林成和搜狗副总裁吴昊讨论了人工智能和硬件问题。
现场报道:今天
(ID:chuangkem)资料来源:Maker Cat
搜狗是中国第四大互联网公司,其主要的搜索和输入业务已经达到数千家。技术进一步强调了与AI的相关性,并通过在现实场景中应用AI技术开始了实验。
Sogo也专注于翻译。随着人工智能翻译领域技术和场景的不断进步,“翻译”在2018年成为搜狗新关键词之一。无论是搜索引擎还是方法,搜狗都从一开始就使用软件为用户创造价值。在AI波中,硬件是“独立的”。
自今年第一季度以来,搜狗已经发布了两款基于人工智能技术,搜狗旅游翻译和搜狗录音翻译笔的翻译硬件产品。
搜狗于2018年3月宣布推出首款智能翻译硬件。搜狗旅行翻译宝具备离线翻译和翻译图片功能,支持42种语言的对话翻译的,出行问题场景的用户,我不说,真正的问题产品在京东平台的第一天它售罄,销售第一天就成了销售的黑马,超过了1000万。
搜狗的旅行翻译宝并不是业界第一。虽然公司如科大讯飞和网易之前也有类似的产品,搜狗重要的是要发现,是人工智能技术和自身的具体应用相结合的最佳供应商。AI的战略地形
鉴于搜狗人工智能翻译硬件的成功,很多人都对此感兴趣。“人工智能翻译硬件在移动应用程序面前有哪些优势?为什么搜狗会创建翻译和翻译硬件?”
搜狗副总裁吴昊表示,翻译硬件的好处有三点。其次,它具有强大的计算能力,使用起来很软。第三,您可以执行手机无法使用的操作。
关于价格竞争,吴昊强调,整个市场还不可能进行价格竞争,而不仅仅是价格竞争。“Soouou在这一点上非常有信心,并将在后续行动中增加对该领域的投资,以做其他人不能做的事情。
吴昊说:在未来,搜狗智能翻译硬件不会停止创新的步伐,适应网站的实际使用,为用户提供更实用的产品
搜狗吴浩副总裁
以下是对话框的记录:(由cat maker编辑,有些已被删除)
张林成:吴总是负责硬件。这也是困扰很多人的问题。搜狗之前的硬件与儿童有关,包括手表,手镯等,现在他正准备制作着名的翻译宝产品。吴昊:这是一个孩子的手表,大约四年前。那时,有一小波智能硬件。巧合的是我当时有了我的儿子,我想为他制作一个产品。五金下属公司。很多人问我为什么要使用硬件?但是当一个圈子朋友遇见我时,他们都问道。移动互联网包括物联网。我们与内部团队讨论了我们正在运行的应用程序,但此应用程序只需要一个硬件shell。例如,在移动互联网时代,为什么人们倾向于在物联网时代做APP和制作硬件?
张林成:你能告诉我们儿童手表市场是什么吗?手镯在美妙的氛围中似乎不太好用。你觉得今年怎么样?
吴昊:儿童手表经历了3到4年的发展。从市场规模来看,仍有稳步增长的趋势,但现在看孩子主要局限于两个方面。搜狗在AI的设计相对较快,基本功能有些先进,但使用主要功能的方式是市场产品,没有特别好的操作员。
另一方面,重复硬件产业链还不够快。现在,大多数儿童手表几年前都可以看到设备和组件是手机或其他设备的配件。由于整个行业的供应链系统没有重复,产品在许多市场都是同质化的,这已成为现阶段的发展瓶颈。像手表一样,它对未来的孩子来说一定是一个非常好的职业。
张林成:你如何分发翻译产品和手表的方法?吴昊:这里没有重心的概念,众所周知,搜狗一直依赖语言作为人工智能设计的核心。前两个比较受欢迎的产品:第一个输入法,第二个搜索法,都是主要用语言输入和输出。在人工智能时代,通过公司整体的中心战略,向上的方向语言感知层有两个方面。一个是基于语音识别做很多事情,另一个是与图像有关。由于识别的OCR水平(光学字符识别)行业,这是在语言识别水平进行做了很多事情,但认知水平也低,搜狗已经在它的??作为输入法积累。搜索让我们有机会在理解自然语言方面做更多的事情简单而原创的输入工具可以为您提供所需的内容,它将成为对话的工具。人工智能将帮助人们更好地回答别人的问题。原始搜索进行了大量的信息搜索。毕竟,你仍然需要给人们更多的结果。你需要找到答案。现在将50% - 70%的搜索结果转换为直接回复。这是基于对我们语言的理解,我们也建立了自己的知识地图,将有一个很好的机会将搜索发展为问答。
感知和认知过程表明我们在所有语言的封闭语言中都有自己的交互,并且存在翻译语言之间的维度之间的交互。近年来,人工智能深度学习领域的翻译速度非常快,基本达到了可用性水平。张林成:我对智能产品很感兴趣。如果新闻发布会上有很多产品,请翻译人员使用手机和应用程序。硬件,硬件和移动应用程序的原因,提高伍皓:一方面,特别是近年来,通过NMT的重复,有很多应用已经涨了许多移动应用程序的翻译水平。我们将促进旅游翻译的宝藏,我们将发挥游客的场景,还有当你真正使用这个产品的一些要点:首先,互动的方式与手机滨田在另一方面,有必要按屏幕,实在不方便跟别人说话;其次,由于识别的声音范围是比较接近的手机将在近距离工作。第三,许多产品网络并不是特别稳定。在中国,4G非常强大,使用非常顺畅。
因此,在定义此类产品时,有两个主要卖点。首先,我想离线玩,但在设备上独立使用手机非常方便快捷。每个人都知道有几种与Sogou类似的翻译产品硬件的竞争产品,但不幸的是我没有做任何视觉上的事情。这个愿景比言语更重要。像中国人和亚洲人一样,这是相对隐含的。没有人会问你一个问题。我解决了我自己可以解决的问题。例如,我们仍然无法在视觉场景中解决道路标志,菜单,产品信息等方面的问题。
一是计算能力。从市场上有很多手机,特别是1000元的机器计算能力。现在,他们称我们为翻译宝藏。实际上有三款发动机:一个用于识别,一个翻译,虽然三是这三种模式的合成的声音在云中没有问题,最大的挑战是将离线设备上是的。你的行动
其次,深度学习训练模型在发布后是巨大的。使本地设备成为内存挑战也非常重要。在一个独立的硬件设备上,两个G的内存几乎完全填满,基本上不可能打开两部带两部手机的手机。2G内存是在时区,独立的硬件设备,例如一个很好的经验,但它仍然是必要的,从长远来看,更多的MPU和TPU是,手机有可能得到解决。这个问题张林成:目前,他最为知名的是科达迅飞制造的产品。微软和小米正在合作创建类似的翻译产品。与这两个竞争对手或市场上的竞争对手相比,我们公司有哪些优势?吴昊:如果单独看,竞争障碍并不完美。例如,ASR(自动语音识别)目前正由许多人执行,包括几种OCR技术。首先,搜狗的优势在于一般的核心设计策略,即主要是语言和语言,以及将我们的语言用作闭路。我们的核心竞争力非常强。在认知层面,我们的基本障碍相对较高。在对话层面,我们都知道它目前会干扰人工智能。最大的问题仍不足以满足需求。为什么不呢?在理解自然语言时,我认为对话系统仍有很多机会可以促进。在这种情况下,有一种输入法,因此对话和自然交互有很大的优势。在交互式系统中,我们在内部将其称为“VUI”(语音用户界面的缩写,语音对话)。我们有自己的优势。不仅是小米和新闻,而且这有很多竞争障碍第三,搜索引擎是过去行业中技术障碍最多的行业。我们正在配置所有智能问题和答案的引擎,我们根据对语言的理解,对问答系统的理解,知识地图进行搜索。江苏省卫视“终于一站式”,王子机器人和人类玩家回复道。今年年初,有一场视频比赛。Sogou能够通过语音传输通过ASR设置响应助手来理解主持人因为版主读了很多问题,所以视频OCR可以快速识别屏幕上的答案并快速推荐它。基于这种完美能力的认知能力从对话到问答的声音是我们的竞争障碍。即使你只看到市场上的竞争对手,你现在提到的名字并不重要。具有独特竞争力对他们来说非常有竞争力
张林成:至于价格,是时候打价格战了。因为小米比我们便宜,其他朋友比我们贵一点。我们在中间。
吴浩:现在整个市场都无法获得价格竞争或证券竞争。今天的介绍和开发时间很长,因为人工智能技术的投入成本很高,但并不是每个参加价格竞争的人都有自己的核心技术。主要技术来自其他人的家,基本技术很少。可以毫不夸张地说,我们收到了很多用户的评论,而在垂直受众中,搜狗翻译的评价是第一个实用的翻译。基本上它与在线水平相同。这非常可靠。我们将继续增加这方面的投资。我们可以为别人做。价格是他们唯一的好处,只有当没有其他人强大时。
张林成:下一个产品搜狗开发计划,那么有两个翻译产品。你有第三个翻译产品吗?吴昊:我已经讲过了搜狗AI的逻辑。基于这种逻辑,产品不断发展,但它们仍然分为几个方面:首先,关于语言信息,我们将做这个领域。我们将这些场景联系起来,包括与会议场景相关的媒体朋友和学生的一些记录和笔记,例如过去的信息,例如,包括小型会议场景的同声传译我再说一遍。其次,我们能够与VUI作为一个整体以及语言进行交互,并且我们还具有完整的问答能力以及VPA(矢量电位分析)功能。VPA的功能:您无法拨打个人移动场景,汽车场景,家庭场景等电话。有一个类似于有共同需求的扬声器的晚餐,但有一些产品包括垂直型观众的特殊场景。下半年有3到4个版本的智能硬件。
如上所述,活猫制造商的报告将指明来源,如果有重印
猫制造商
创业第一媒体
现场/报道/合作
更多微信:weiyangfan 001
长按QR码符合要求