OpenAI語音轉寫工具Whisper遭遇重大缺陷:生成的轉錄文本現AI幻覺現象快訊
一位開發人員在其用Whisper生成的26000份轉錄中發現,幻覺現象的普遍性 研究人員和工程師在工作中發現,發現大約一半的內容存在幻覺現象。
【TechWeb】美聯社近日的最新報道揭露了一個關于OpenAI的語音轉寫工具Whisper的重大缺陷。
據超過十位軟件工程師、開發人員和學術研究人員透露,Whisper有時會生成大量虛假內容,這些內容被稱為“AI幻覺”。這些幻覺內容可能包含種族歧視言論、暴力語言,甚至不實醫療建議。
Whispers的廣泛應用和潛在風險
Whisper工具已被廣泛應用于全球多個行業,包括翻譯、訪談內容轉錄、生成消費科技文本和視頻字幕制作等。這種廣泛的應用使得Whisper的“幻覺”問題變得更加嚴重,因為它可能會在不經意間傳播錯誤信息。
尤其是對于醫療機構來說,這一問題更為棘手。盡管OpenAI已經提醒用戶不應在“高風險領域”使用Whisper,但一些醫療機構仍在急于采用基于Whisper的工具來記錄醫生與患者的咨詢記錄。
幻覺現象的普遍性
研究人員和工程師在工作中發現,Whisper的幻覺現象相當普遍。例如,密歇根大學的一位研究員在研究公共會議時發現,在嘗試改進模型前,他所檢查的十份音頻轉錄中,有八份含有虛構內容。另一位機器學習工程師在分析超過100小時的Whisper轉錄時,發現大約一半的內容存在幻覺現象。
一位開發人員在其用Whisper生成的26000份轉錄中發現,幾乎每一份都帶有虛構內容。即便是音質良好的簡短音頻樣本,也未能幸免于這些問題。計算機科學家們的研究表明,在審查的13000多段清晰音頻片段中,有187段出現了幻覺現象。
OpenAI的回應
面對這一發現,OpenAI的發言人表示,公司正在持續研究如何減少幻覺,并感謝研究者的反饋。OpenAI承諾將在模型更新中采納這些反饋,以改善Whisper的性能和可靠性。(Suky)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。