彩票365下载_彩票365官网app|官网手机购彩

彩票365官网手机购彩技术

当前位置:彩票365下载 > 彩票365官网手机购彩技术 > 彩票365下载:中国科学技术大学讯飞翻译机,语

彩票365下载:中国科学技术大学讯飞翻译机,语

来源:http://www.aysygc.com 作者:彩票365下载 时间:2019-11-28 14:49

原标题:阿里 AI——智能互动设备的探索设计

原标题:「语音交互设计」之 VUI简析| L-insights

这是第9次的白日梦,预计阅读时间15分钟

最近组内做分享,想来想去就讲“语音交互设计”这个主题吧,以下是我分享内容的PPT,内容比较基础。

彩票365下载 1小象要悄咪咪搞大事情啦!" style="width:60%;margin:1rem auto">

设计也需要在每个场景中分别做出判断,行业通用的部分沉淀,以及行业特性的个性化设计思考,都是需要不断的去尝试和打磨的。而智能互动设备作为一种趋势,也是设计师去发挥所长的沃土。

近来,智能语音交互市场的热度可谓一路飙升。

最近在做的VR项目里需要用到语音交互(其实是因为只靠头控的操作太反人类,手势的精度又低到没法用,所以只能求助万能的语音了),于是在网上找了些关于语音交互的资料,不过可能是语音交互的应用范围并没有图形界面那么广,其设计的原则和方法也并不系统,更多的是一些经验之谈,言归正传,接下来就看看语音设计都有哪些设计要点需要注意。

彩票365下载 2

{"type":1,"value":"普象网

彩票365下载 3

  • 微软Build大会发布智能音箱Invoke,
  • 苹果WWDC发布HomePod,
  • 百度AI开发者大会发布DureOS开放平台,
  • 阿里人工智能实验室发布天猫精灵,
  • 亚马逊推出语音助手Alexa…

作者Laura Klein

彩票365下载 4

已经成立三周年了

5号小蜜:智能互动设备的初期准备

随着智能音箱ALEXA接入超过2万种设备,亚马逊在人工智能领域实现了一次跨界奇迹,离实现“speaking to future”的梦想又更近了一步。另外,据ComScore报道称:苹果iOS 和HomePod 设备的Siri每月拥有超过4000万用户,美国家庭中更是将近1/10已拥有了一位智能语音助手,并且由于屏幕疲劳这个无法避免的问题,智能语音越来越被人们接受,语音交互技术也正变得越来越普遍。

随着科技的发展,人机交互发生着巨大的变化,智能家居,智能车等智能硬件的普及,人们越来越需要一种不依赖于键盘鼠标显示器的交互方式。同时,语音输入技术上的重大进步也使得人们可以用更为自然直观的方式和设备进行“交流”。因此,设计师也需要具备一些语音交互的设计方法来设计出更为可用的语音交互方式。

彩票365下载 5

这个期间累积了大量的原创设计师来入驻

在如今智能硬件设备,语音互动的大趋势下,我们针对实体智能互动的硬件,从想法 – 设备 – 技术 – 设计 – 场景,总结沉淀了部分探索经验。

“语音交互将改变我们的生活。”

**░ 语音识别技术简介  **

在做语音交互之前,我们需要知道语音识别技术的实现原理以便知道现有技术存在的几个重要限制。

当我们在设计语音交互时,我们需要对语音输入及(系统的)语音反馈进行设计。这就好比在设计对话,作为设计师,我们必须确保“对话”的双方都能很好的理解对方。

那么相应的,语音输入也存在两个技术关键点:语音识别和语义理解。早期的语音设备只是对语音进行听写,而对语义的理解远比识别语音要难。

在过去的20年中,对语音的识别、理解、自动回复方面有了重大的发展,在90年代,工程师和语言学家花费了大量时间来训练系统识别特殊词语。

这些被称作“有限状态语法”(finite state grammars),既系统只能识别一系列有限的词和短语。现在很多自动语音应答系统还在使用,例如一些自动回复的电信业务(银行业务查询等)。

随着技术的进步,“统计语言模型”(statistical language models)被用在更多的产品上。系统不再限定在识别特定的词和短语,而是可以将声音对应到特定的字符串。换句话说,你不用直接教siri“纽约明天天气怎么样?”这个短语,siri可以通过将你的发音听写成单词然后将这些单词匹配出相应的意思。

这一系列的识别,加上机器学习方面的进步,使得自然语言的交互成为可能。随着自然语言交互的发展,机器不止能识别我们说的话,还能够理解话的内容并做出正确的答复。这点虽然对人来说很简单,但对一台机器来说已经相当科幻。

彩票365下载 6

现在网站每两周会评选一次

彩票365下载 7

  • “帮我看一下明天的天气“
  • "给我订一辆出租车"
  • “替我放一些爵士乐”

**语音交互(VUI)和图形交互(GUI):相同和不同**

对语音交互设计师而言,以上的这些科技进步相当重要,因为它们可以让我们以一种20年前科幻小说中的方式来与机器“对话”。但我们还需要找到有效的设计方法来最大程度的利用这种科技进步。幸运的是,图形界面设计中的以用户为中心的设计理念很多可以复用到语音设计中,我们不需要完全从头开始,但也要知道有哪些新的模式需要注意。

交互设计(ux)中最重要的角色是用户,一切流程都是围绕用户为中心展开的,这点在语音设计中是相同的。Thomas Hebner作为一个从事了16年语音设计的设计师,他认为语音设计中最重大的错误往往发生在用户目标和业务目标不一致的情况下。

优秀的产品通常都是能快速解决真正的用户需求,同时很适合他们的使用场景。我们需要的是能感知上下文的设计,比如我在家说“温度升高点”,系统要知道我指的是暖气还是烤面包机。这种感知上下文的能力与语音识别技术无关,主要看设计师对系统对话的设计是否巧妙。

以上这些很重要,理解用户、使用中对上下文的感知、可用性与易用性这些通常用在评判GUI的设计标准同样适用于语音交互(VUI),所以传统的交互设计师可以很好的将自己在GUI方面的设计经验移植到VUI上。

但也有一些关于VUI的特殊设计要点需要特别注意。

去年扎克伯格接收了一个个人挑战,去建立一个带语音交互的AI来管理自己的家,叫做jarvis,就是钢铁侠里的那个jarvis,还加上了Morgan freeman的音色,像钢铁侠里的jarvis智能管家相信是很多人期望的。

普象原创设计TOP榜

首先交代一下背景:

▼会话能力

内容和调性对于每个设计都很重要,但在设计语音输出时尤为重要。好的语音设计可以让用户在使用时感觉像在进行正常的对话,但对于电脑而言,像人类一样会话相当困难。

Tony Sheeder一位从事超过14年语音设计的设计师解释道:

每段语音交互都好比一个简短的记叙文,有开头、过程和结尾。人类对这些会话规则了如指掌,所以当你参加一个聚会,你会很快发现哪些人比较容易交流。现在的大多数语音系统就好比那个在聚会上说什么都是错的,别人都不喜欢和他交流的“人”。

早期的语音设计师大多有语言学的背景,Tony Sheeder最初是为互动游戏编写对话的,这也帮助他能够很好的编写出自然顺畅的会话。但设计语音交流并不总是一帆风顺的,早期的语音交互会让用户感到不舒服,因为设计师认为用户需要系统给出明确的指示,系统一般会说“是否需要查询你的账户余额?请回答是或否”这违反了会话的基本原则。Sheeder认为互动式语音应答系统(IVR)希望自己像人类一样说话,但同时希望你像狗一样回答,这点是用户感到不舒服的主要原因。

彩票365下载 8

获奖的设计师大大将会获得小象

在阿里小蜜语音助手的形态下,延伸出了很多智能相关的研究和探索,其中智能硬件也是我们想要去发展的一部分。在这种情况下,以“5号小蜜”为名称的智能互动硬件设备应势而生。

在Gartner总结的2017年几大趋势中,virtual assistants处于热点的最高位,在2018年也是居高不下。

**▼设计更好的交流技巧**

许多设计师强调文案在体验中的重要性,如果你希望在产品中加入语音功能,那么你需要学习以下一些重要的规则让你的语音交互体验更好。

交互式语音应答诞生于上世纪70年代普及于2000年,拨打10086,你会听到欢迎致电中国移动,智能客服快速查询办理请按6,手机业务请按7,宽带业务请按5,集团业务请按8,重听请按9,人工服务请按0,但是有没有觉得按一串1,0呀,有种摔手机的冲动。

精心挑选的礼物

(名称解释:在决定做这个产品的初期,是以落地到公司的5号行政楼为场景的前提下进行的设想,所以叫“5号小蜜”)。

彩票365下载 9

**▼保持简短,但不能太短**

当系统太过于健谈时,体验会变得相当糟糕,尤其是在无输入系统中,语言要相当简明并使用户始终主导交互的节奏。简言之,在设计对话时要保证简洁但也不要过于简短。

书面语言完全不同于口语。当你开始写一段会话时,你会发现它读起来很生硬或者让机器读起来过于冗长。这其实很常见,你需要保持所有的会话比你想象的要短的多。如果不这样,用户很容易失去耐心听完从而可能错过重要信息。

另一方面,你同时需要注意不要省略重要的信息。sheeder谈到了早期的语音自动应答中心的设计,设计的核心目标是让所有东西尽量简短。“有一个理念是:若在一次通话中减少750毫秒就可以提高效率,但通过剔除连接词和过渡短语反而会增加用户的认知压力从而使效率降低。”当反馈太快时会对听者造成很大压力,他们会因为无法及时处理信息而变得挫败,最终使得自动应答中心的整体效率降低。

手机语音助手,siri是2011年iphone4s发布会上发布的,Cortana是2014年win8发布会上发布的。一开始大家对这种语音对话的形式感到很有趣,但尝试一段时间后发现,除了让它讲个笑话以及偶尔调戏一下逗逗乐子以外,再也想不到要唤醒它干嘛。

同时会被小象拉进传说中的设计师大神群哟~

在有了这个想法后,5号小蜜进行了1.0版本的研究和设计,在项目初期我们的承载硬件主要是以55寸,比例为16:9的液晶屏幕为主,用机器人的虚拟形象进行语音的互动,其中的场景设定也是在访客进入到5号行政楼进行互动的能力。

source:gartner. com

**▼创造性格**

人们会把能与他们交谈的东西当做人类对待,而每个“人类”都是具有性格的。在VUI中同样是这样,苹果的siri,微软的cortana和亚马逊的a'lexa都分别具有完全不同的性格。

成功的语音系统拥有性格不只是为了好玩,同时也是目标导向的,冷静正式的性格可以提高效率,而亲切的性格可以让用户更愿意交流。

拥有个性也可以帮助你设计会话。在某方面,个性就像是在GUI设计中的风格指南,可以帮助你确定应该用什么词汇和语气来组织会话。而决定运用什么性格是由你的产品目标和用户特征决定的。但无论如何要记住,你的语音系统可能会被用户长时间多次使用,所以你选取的性格不能是那种随着时间推移会让人厌烦的,比如过多的冷笑话或者喋喋不休的重复。

还有一个地方需要注意,当你将系统设计的带有性格时,系统会变得更加拟人化,而用户也会把系统当做一个“人”来对待。这时用户对系统的智能化要求也会相应提高,当发现系统并不是很智能时,反而会增大挫败感,这也是为什么用户会对siri要求的格外严格。

智能音箱,2014年亚马逊发布echo音箱,拉开了远场语音交互的帷幕,智能音箱它具有语音交互可提供内容服务、互联网服务、以及场景化的智能家居控制能力,所以最近几年,国内外的巨头纷纷布局智能音箱市场,Google home,apple home pod,京东科大讯飞的叮咚,阿里的天猫精灵,小米的小爱同学。

小象分享原创设计马不停蹄地迎来了

彩票365下载 10

彩票365下载 11

**▼自我测试**

为了确保会话的自然和高效(不是恼人的),你需要做很多测试。可用性测试是当然要做的,但在这之前,你可以通过以下方法开始提高自己的VUI交互能力。自己扮演你要设计的系统去和其他人对话,将对话录下来然后播放,看是否合适。再让机器读这段会话,以此来测试。

当然所有这些方法与界面设计中用的方法差不多,我们写界面上的文案也需要考虑文风和语气,同时也要保证高效简洁,当然也要进行可用性测试。然而,在以语音为主要交互方式的设计过程中,这些方法套路也需要做如下相应的调整:

彩票365下载 12

第五期

智能互动设备的框架拆解

source:Stephen Kenwright ’s blog

▼可发现性和可预见性

可发现性和可预见性在以语音为主要输入方式的系统中相当重要,尤其是在使用自然语言系统时。在这点上图形用户界面和语音用户界面会有很大不同。

自然语言系统将大部分发起询问的负担都给了用户,相反的,图形界面可以给用户上下文线索,比如提示、询问,甚至是明确的选项。当你登录你的网上银行时,网站通常会给你几个选项,例如你是否想登录或者学习如何新开一个账户。

想象下如果银行像谷歌的语音系统一样。你进入网站然后系统提示你问一个问题。有时会很顺利,如果你恰好是要查询余额,对话就会变得很简单:“查询我的账户余额。”“好的,你的账户密码是多少?”

但如果你想开通一个新的业务帐号,并且与你的储蓄账户绑定,并且有许多选项需要选择,每个选项都有不同的收费方式。这个对话会很难开始,因为你不知道要从何说起,先问什么。甚至很多新功能你都不知道它是否存在,就更不用说去问了。

这类可发现性的问题在设计开放式语音系统时是一个很重要的问题。当Abi Jones第一次设计语音时,她把一个录音设备假设成一个什么都能听懂并回答的机器,“这让我第一次意识到想要说出自己想要什么是多么难的一件事,”她说。

即使在限制输入内容且功能完全外显的语音交互中(例如一些只能让用户说特定词的应答系统),设计师还是要处理一系列无法预测的用户应答。在可视化产品中,我们所做出的大部分选择被用户界面限制。有能点击的按钮,供选择的选项,可拖动的滑块。当然也会有开放式的文本输入框,但他的出现一定会有上下文提示它的作用。当你在谷歌搜索框中输入时,即使输入这个行为本身不可预知,但上下文的信息也能让用户按照设计者的意图进行操作。

与此相反的,siri需要根据你的输入来确定做出什么响应。是打开一个app?搜索网络?还是给某个联系人发短信?输入的不可预测性对设计师而言是个棘手的事情,如果我们想要限制用户输入或让用户知道他们能做什么,设计师就需要预测更多的使用情景来尽可能多的覆盖用户可能的应答。

彩票365下载 13

原创设计师—周胜

在有了初步的进展之后,我们以设计师的视角总结了智能互动类设备的基础框架,为我们之后的升级和完善进行了整体的方向指导。

语音交互的主要特点在于开放式聊天功能和任务导向型功能

▼设计更好的可发现性和可预见性

想要让你的语音系统的功能更为可见,首先你需要让系统积极主动,先发制人。与其让用户自己想起来他们要干什么,不如系统先发起对话,问问用户他们需要干啥。

Karen Kaushansky认为这方面cortana做的很好,如果你在开车并带着蓝牙耳机,此时你接到一条短信,cortana会知道你正在开车,它会询问是否需要帮你阅读短信内容,但如果蓝牙耳机关着他就不会这么做,因为外放音读短信可能牵扯隐私。以上可以看出,cortana已经可以联系上下文并且主动发起会话。通过触发基于上下文的提示,可以帮助用户发现隐藏功能,上面的例子中用户就知道了cortana可以读短信。

另一个选择是向用户解释他们应该说什么。许多使用自然语言的系统开始像早期应答系统一样给用户各种提示。例如,他们不会再问“你需要什么帮助?”,取而代之的是“你需要什么帮助么?你可以说:查询银行收支、申请支票、汇款等。”虽然对用户而言,即便科技已经很发达了,但提示用户“你可以尝试说。。。”仍是比较好的启发用户发问的方式。

一个语音交互系统形象的来说也需要耳朵、大脑和嘴巴。听觉是怎么产生的,声音通过外耳接收,鼓膜和听小骨振动传到内耳,内耳的感受器官把声能转换为神经冲动,再经过神经传入中枢。麦克风拾音就相当于外耳接收声音,语音识别将语音转换为文字就相当于将鼓膜将声波的振动化,语音解析把文字转换成机器理解的语言就相当于内耳感受器官转换为神经冲动。大脑怎么运作我就不知道了,而我们用自然语言处理技术来理解语义,人工智能人工大脑来做问题求解等等。最后通过大脑处理生成一些自然语言句子,就通过嘴来说出来,也就是这里的语音合成。

作品:科大讯飞翻译机

彩票365下载 14

如果说快捷高效、轻松自然是语音交互的独特优势,那么任务导向型功能就是这些优势的完美落点。一个良好的语音交互产品,自然是技多不压身,能覆盖的范围越多越好,提供的功能越强大越好。

**▼隐私和易用性**

一个在语音,尤其是纯语音的交互中很显然的问题是:一切都会被他人听到。当然,让系统播放歌曲这种命令没什么问题,但假如在一个开放的办公室里系统朗读了你的健康记录,事情就会比较糟糕。所以上下文仍然相当重要。

Rebecca Nowlin Green,一名在Nuance通信公司工作的商业总顾问,她解释道好的语音系统应该在敏感信息方面设置撤回输入的方式,包括使用其他方式展示。

易用性也是一个问题,虽然语音识别技术已经发展的很好了,但在非母语用户、嘈杂环境下或者网络不畅通的环境下识别精度仍会大大降低。所以使用环境会对系统的可用性和适用性产生很大影响。

彩票365下载 15

设计关键词:专业工具属性、品质感、直观的交互。

首先智能互动设备的核心支撑能力一定是算法的能力,而当前市面上的智能硬件大多数是以语音助理的形态出现的,因此对于设计师来说,VUI是重要的一环,5号小蜜不单单是语音的交互,也是视觉上的交互。因此在感知层面的设计上来说,是“VUI GUI”也就是听觉和视觉的互动(但在硬件多样发展的今天,触觉类也应该是要考虑到感知层面的一部分)。

下面小线菌将从语音交互中的VUI开始,为大家扒一扒语音交互那些事儿。

▼为隐私和易用性而设计

好的隐私设计的关键是理解用户会在什么情况下需要信息以更加私人的方式呈现,且这些信息出现时的上下文是什么。没有人愿意在地铁上喊出自己的社保密码,但在某些情况下甚至连短信的发送人这种信息都会牵扯到隐私。

让设备能够轻松的切换到无声模式并且支持多种输入和输出方法对保证隐私至关重要。而一个反应灵敏的应答系统也会对隐私有所帮助。例如生活中,当你小声对一个人说话时,对方也会小声的回应。我们通过周围的人的反应及时调整自己,可是机器不会,它只会用同样的音量做出应答。所以在设计语音系统时将环境噪音、位置、接收到的音量考虑在内并做出处理可以大大改善隐私问题。

对上下文的理解可以改善易用性。例如一个叫做TRNQL的致力于开发便于语音输入输出SDK的初创项目。其中有一个设计是当系统检测到用户是坐着的时候,输入方式是键盘输入,而当感知到用户在走路时,默认输入会切换到语音。这样就会避免在行走中看手机而发生事故。

当我们的设备对我们越来越了解——我们住在哪,在哪工作,我们什么时间在听歌或看电影——系统可以更好的判断什么时候以何种方式与我们交互。但易用性和隐私之间需要有一个度,我们可能会希望我们的系统知道我们在走路但不希望它知道我们在哪走。这些问题在手机和私人设备的设计中需要着重考虑。

记住,隐私和易用性问题是严肃且不好解决的问题,了解用户介意哪些信息以及信息所处的上下文可以帮助你知道如何做能既保护了用户的隐私又能给用户提供便利。

彩票365下载 16

项目背景:2017年初第一代科大讯飞翻译机在京东开启预售,产品定价2999元。标志着科大讯飞在C端的布局日益加强,除讯飞输入法外,独立品牌的产品还包括讯飞听见平台、讯飞车载助手小飞鱼、讯飞翻译机、阿尔法蛋机器人等,这些产品为AI语音识别技术的硬件化找到了一条通道。

VUI GUI对比传统语音交互会有一些优势体现:在互动方面,语音可以理解为面,单一面传递信息是有限的,如果语音和界面结合起来,就是从两个单一面形成了空间,可以承载更多的信息。

VUI简史

**▼纯语音系统和混合式操作系统**

早期的语音设备常见于大公司针对个人用户开通的电话自动应答系统。现在的语音系统多用在智能家居、手机和可穿戴设备上。有趣的是,这些设备都具有多种输入输出方式,比如屏幕、灯光甚至物理键盘。这些混合式交互系统给了设计极大的可能性。

不幸的是,很多公司只是因为语音比较酷而将语音引入他们的设备。他们认为用户更喜欢直接发问而不是根据系统给出的结构进行会话,因此他们更喜欢引入自然语意系统。同时,为了减少干扰而去掉屏幕或物理按键。

但只有当某些特殊场景下需要引入语音才能解决某些需求时,语音的引入才有意义,否则随意的使用语音只会适得其反。

你需要考虑的是一个语音对话能够如何改善某个用例的体验。比如在输入中,有些信息很容易说出来,但很难手动输入;而有些则容易“写”出来,却不容易“说出口”,语音输出存在同样的问题。

例如这则对话:“siri,告诉我旧金山北部市场中提供午餐且还没关门的所有餐厅。”但你肯定不希望siri将全部760家符合条件的餐厅都念给你,所以这个场景适合语音输入,屏幕输出。

但如果在我们平时用百度地图导航时,我们更习惯于输入目的地进行路线查询,在确认好路线时用语音进行导航。所以这个场景适合屏幕输入,语音输出。

所以,作为设计师,如何决定何时何地使用什么输入输出方式需要我们根据设备、任务和上下文来做特殊处理,但也存在一些通用的原则可以参考。

纵观计算机发展史,人机交互也从DOS系统下的命令行界面 Command line interface,到乔布斯从施乐公司那里触发灵感,用在1984年mac上的GUI,再接着iphone触控交互,再到如今语音交互的研究,我们一直在寻找更加友好的人机交互方式。

彩票365下载 17

本文由彩票365下载发布于彩票365官网手机购彩技术,转载请注明出处:彩票365下载:中国科学技术大学讯飞翻译机,语

关键词: 彩票365下载

上一篇:彩票365下载价格有望亲民,真机曝光

下一篇:没有了