北美首頁  |  新聞  |  時尚  |  大陸  |  臺灣  |  美國  |  娛樂  |  體育  |  財經  |  圖片  |  移民  |  微博  |  健康

爲什麼語音助理都用女聲 谷歌產品經理說真相

http://dailynews.sina.com   2019年09月24日 04:31   中國日報

 

 

(綜合報導)稍早《衛報》曝光語音助理 Siri 的內部文件,顯示蘋果爲了避免 Siri 回答問題時有性別偏見,爲 Siri 制定了一系列道德規範。

 

很長一段時間,蘋果、Google 、微軟等科技公司的語音助理都預設女聲,聯合國報告指出是因爲軟體設計由男性主導,加強性別偏見的傳播。

 

最近 Google 負責 TTS (Text-to-Speech,文本轉語音)的產品經理 Brant Ward 接受採訪時,卻有不一樣的答案。他表示,Google 第一次推出語音助理時,其實想用男聲,選擇女聲是無奈之舉。

 

Google 本來想推出同時支援男聲和女聲的語音助理,但傳統 TTS 系統卻很難做到,因爲這套系統接受的訓練數據都是女性,女聲的效果也更好。

 

爲什麼 Google 的 TTS 系統採用的訓練樣本女性多於男性,Brant Ward 表示,由於女聲音調更清楚,當時的系統更容易聽懂。

 

女聲更容易辨識,過去幾十年這觀念逐漸成了「文本轉語音」領域的共識,因此 Google 等公司一度放棄開發男聲語音助理,可能也是一種偏見。

 

車載語音系統 Cerence 的 TTS 開發總監 Johan Wouters 表示,沒有任何科學證據表明女聲讓機器更容易理解,男聲和女聲的開發沒有技術差異,開發的難度並不是語音助理多爲女聲的主要原因。

 

Brant Ward 也回應 Johan Wouters 的質疑,表示他的分析只適用 Google 的系統。

 

此外,隨著 AI 技術出現,Google 已解決了這個問題。透過 Google 母公司 Alphabet 旗下的人工智慧公司 DeepMind 提供的新演算法 WaveNet,能用更少訓練樣本,生成更逼真的人聲。

 

得益於 WaveNet,Google Assistant 在 2017 年 10 月開始支援男聲,目前 Google 已在全球 7 個國家推出支援男聲的語音助理,甚至帶有當地口音,如有英國和美國南部口音。

 

但如果把語音助理預設爲男聲,是否又是另一種性別偏見?Google 的解決方法是,男聲和女聲爲隨機配給用戶,每種性別的聲音都有 50% 的使用機率。

 

不得不說,蘋果和 Google 這些科技巨頭爲了避免「性別不平等」的指摘,真是如履薄冰了。不管怎麼說,科技產品對不同性別和文化的包容,意味著用戶有更多選擇,終究不是壞事。

 

世界第一個無性別語音助理名叫 Q

 

 

智慧語音助理的聲音,除了預設的女聲和可選的男聲,現在有了新選擇。

 

世界第一個無性別的智慧語音助理最近誕生了,名字叫 Q。它的嗓音不是女聲也不是男聲,有時會覺得是男聲,有時又覺得是女聲,感覺相當奇妙,且音色讓人聽來很舒服。可至官網聽聽 Q 的自我介紹。

 

 

Q 的誕生是爲了終結目前人工智慧助理的性別刻板印象,由多個組織共同推動完成,包括丹麥多元文化組織「Copenhagen Pride」、青年文化媒體 Vice 旗下的創意服務機構 Virtue Worldwide、致力消除人工智慧無意識偏見的 Equal AI、數位創意工作室 Koalition Interactive,以及音響設計工作室 thirtysoundsgood。

 

哥本哈根大學語言學家和研究人員採集了 5 人的聲音合成、調校,最後匯出一道聲源。聲源發表前在歐洲經 4,600 人評分,從 1 到 5,代表偏男聲到偏女聲,最後才得到性別中立的聲音,參數爲 145 赫茲。

 

 

Q 的創造者認爲,科技公司通常將人工智慧助理預設設定爲女性,或可選男性聲音,這做法只加強用戶的性別二元對立認知,也就是讓用戶覺得世上只有女性或男性這兩種性別。

 

事實上,一些羣體不是傳統意義的女性或男性,隨著他/她們逐漸被社會認可,大衆認知的性別二元對立也慢慢被打破。

 

Q 代表更包容的聲音和技術,性別認知也應該是技術開發者和科技公司未來要考量的因素。

 

不過 Q 目前只是聲音,並非人工智慧框架。Q 的創造者希望它能讓正在開發和推廣人工智慧語音助理的科技公司,意識到產品的侷限性。

 

各類語音助理聲音的背後,潛藏著人們無意識的性別刻板印象,同時也加深大衆性別認知的刻板印象。

 

從蘋果 Siri、微軟 Cortana、亞馬遜 Alexa、Google Assistant,到小米的小愛同學、阿里天貓精靈,智慧助理一開啓總是預設女聲。

 

這些女聲播報總給人可愛、溫柔、樂於助人的感覺。智慧助理擬人化的過程中,目標是成爲忠誠執行工作的助理,它們不求回報地幫你查天氣,開關智慧家電,甚至不要求你說「謝謝」。

 

相比之下,預設使用男聲的場景,通常帶有權威、警示,比如銀行或保險應用。電影《流浪地球》太空站的人工智慧 MOSS 就是男聲,它能以聯合政府的名義全球廣播,也能控制整個太空站的電腦。

 

語音是下一時代的互動方式,在在影響我們的認知和行爲。世界是多元的,技術驅動的語音助理,也應該是多元的。

 

 

 

Bookmark and Share
|
關閉