[attach]123913160[/attach] 人工智能產品越趨發達﹐以人類作為藍本的各種功能設計都能以假亂真﹑讓人以為這些機器人就是我們的同類。最新研發的產品﹐所包含的元素就是每天不斷在我們生活物中上演的「選擇性注意力(selective attention)」﹐也正是因為人類具備這樣的能力﹐才能在人海茫茫中與特定的幾個人進行互動﹐而不受外界干擾。
這個作品將在今(2018)年8月於加拿大溫哥華的國際計算機圖形與互動技術展(International Conference and Exhibition on Computer Graphics and Interactive Techniques)被展出﹐且強調能將背景音量調低﹑專注聆聽螢幕上的人所說的話。截至目前為止﹐類似的產品多望能將這種自動忽略不相干音訊的能力模擬出來﹐就像人們能在一片喧囂之中聚焦於特定聲音上﹐也就是著名的「雞尾酒效應(the cocktail party effect)」。
不過與過去不同﹐這次的技術結合了視覺與聽覺的環境線索﹐如嘴唇的運動﹐進而協助機器辨識﹑區別講者的說話。研究員於Google舉辦雞尾酒派對來測試這個產品﹐發現有別於過去僅能純粹處理聲音資訊的機器﹐新研發的產品可藉邊聽邊看的過程﹐更準確地區辨2~3人的談話中誰分別說了什麼話﹐甚至能調整等級﹑將環境聲音再調大。
對此﹐來自希伯來大學的計算機科學家佩雷格(Shmuel Peleg)表示﹐未來或許能將此技術用在一些電訊會議(teleconference)上﹐發揮其過濾背景噪音的優越性能﹐可讓人們在聆聽會議內容時聽得更清楚﹑更準確。