北美首页  |  新闻  |  时尚  |  大陆  |  台湾  |  美国  |  娱乐  |  体育  |  财经  |  图片  |  移民  |  微博  |  健康

为什么语音助理都用女声 谷歌产品经理说真相

http://dailynews.sina.com   2019年09月24日 04:31   中国日报

 

 

(综合报导)稍早《卫报》曝光语音助理 Siri 的内部文件,显示苹果为了避免 Siri 回答问题时有性别偏见,为 Siri 制定了一系列道德规范。

 

很长一段时间,苹果、Google 、微软等科技公司的语音助理都预设女声,联合国报告指出是因为软体设计由男性主导,加强性别偏见的传播。

 

最近 Google 负责 TTS (Text-to-Speech,文本转语音)的产品经理 Brant Ward 接受采访时,却有不一样的答案。他表示,Google 第一次推出语音助理时,其实想用男声,选择女声是无奈之举。

 

Google 本来想推出同时支援男声和女声的语音助理,但传统 TTS 系统却很难做到,因为这套系统接受的训练数据都是女性,女声的效果也更好。

 

为什么 Google 的 TTS 系统采用的训练样本女性多于男性,Brant Ward 表示,由于女声音调更清楚,当时的系统更容易听懂。

 

女声更容易辨识,过去几十年这观念逐渐成了「文本转语音」领域的共识,因此 Google 等公司一度放弃开发男声语音助理,可能也是一种偏见。

 

车载语音系统 Cerence 的 TTS 开发总监 Johan Wouters 表示,没有任何科学证据表明女声让机器更容易理解,男声和女声的开发没有技术差异,开发的难度并不是语音助理多为女声的主要原因。

 

Brant Ward 也回应 Johan Wouters 的质疑,表示他的分析只适用 Google 的系统。

 

此外,随著 AI 技术出现,Google 已解决了这个问题。透过 Google 母公司 Alphabet 旗下的人工智慧公司 DeepMind 提供的新演算法 WaveNet,能用更少训练样本,生成更逼真的人声。

 

得益于 WaveNet,Google Assistant 在 2017 年 10 月开始支援男声,目前 Google 已在全球 7 个国家推出支援男声的语音助理,甚至带有当地口音,如有英国和美国南部口音。

 

但如果把语音助理预设为男声,是否又是另一种性别偏见?Google 的解决方法是,男声和女声为随机配给用户,每种性别的声音都有 50% 的使用机率。

 

不得不说,苹果和 Google 这些科技巨头为了避免「性别不平等」的指摘,真是如履薄冰了。不管怎么说,科技产品对不同性别和文化的包容,意味著用户有更多选择,终究不是坏事。

 

世界第一个无性别语音助理名叫 Q

 

 

智慧语音助理的声音,除了预设的女声和可选的男声,现在有了新选择。

 

世界第一个无性别的智慧语音助理最近诞生了,名字叫 Q。它的嗓音不是女声也不是男声,有时会觉得是男声,有时又觉得是女声,感觉相当奇妙,且音色让人听来很舒服。可至官网听听 Q 的自我介绍。

 

 

Q 的诞生是为了终结目前人工智慧助理的性别刻板印象,由多个组织共同推动完成,包括丹麦多元文化组织「Copenhagen Pride」、青年文化媒体 Vice 旗下的创意服务机构 Virtue Worldwide、致力消除人工智慧无意识偏见的 Equal AI、数位创意工作室 Koalition Interactive,以及音响设计工作室 thirtysoundsgood。

 

哥本哈根大学语言学家和研究人员采集了 5 人的声音合成、调校,最后汇出一道声源。声源发表前在欧洲经 4,600 人评分,从 1 到 5,代表偏男声到偏女声,最后才得到性别中立的声音,参数为 145 赫兹。

 

 

Q 的创造者认为,科技公司通常将人工智慧助理预设设定为女性,或可选男性声音,这做法只加强用户的性别二元对立认知,也就是让用户觉得世上只有女性或男性这两种性别。

 

事实上,一些群体不是传统意义的女性或男性,随著他/她们逐渐被社会认可,大众认知的性别二元对立也慢慢被打破。

 

Q 代表更包容的声音和技术,性别认知也应该是技术开发者和科技公司未来要考量的因素。

 

不过 Q 目前只是声音,并非人工智慧框架。Q 的创造者希望它能让正在开发和推广人工智慧语音助理的科技公司,意识到产品的局限性。

 

各类语音助理声音的背后,潜藏著人们无意识的性别刻板印象,同时也加深大众性别认知的刻板印象。

 

从苹果 Siri、微软 Cortana、亚马逊 Alexa、Google Assistant,到小米的小爱同学、阿里天猫精灵,智慧助理一开启总是预设女声。

 

这些女声播报总给人可爱、温柔、乐于助人的感觉。智慧助理拟人化的过程中,目标是成为忠诚执行工作的助理,它们不求回报地帮你查天气,开关智慧家电,甚至不要求你说「谢谢」。

 

相比之下,预设使用男声的场景,通常带有权威、警示,比如银行或保险应用。电影《流浪地球》太空站的人工智慧 MOSS 就是男声,它能以联合政府的名义全球广播,也能控制整个太空站的电脑。

 

语音是下一时代的互动方式,在在影响我们的认知和行为。世界是多元的,技术驱动的语音助理,也应该是多元的。

 

 

 

Bookmark and Share
|
关闭