国产激情综合五月久久_女人夜夜春_国产精品一区二区av_99re视频精品_中文字幕在线欧美_亚洲人人

熱門標簽-網站地圖-注冊-登陸-手機版-投稿 3D打印網,中國3D打印行業門戶網!
當前位置:主頁 > 人工智能 > 正文

每10份音頻就有8份被胡編 OpenAI語音轉錄工具被曝存重大缺陷

時間:2024-10-28 20:42 來源:未知 作者:admin 閱讀:
生成式人工智能領域的領軍者OpenAI,曾吹噓其人工智能轉錄工具Whisper具有接近 “人類水平的穩定性和準確性”。
然而,隨著該轉錄工具在各行各業被越來越多地普及使用,其問題似乎也正開始凸顯——根據業內媒體對十多位軟件工程師、開發人員和學術研究人員的采訪,如今Whisper所存在的一個重大缺陷已愈發不容忽視:它很容易會編造大段文字,甚至是整段句子。
這些業內專家表示,一些編造出的文字——在行業內被稱為“幻覺”,可能包括種族言論、暴力措辭,乃至完全杜撰出的醫療建議。
專家們越來越擔心這種“胡編亂造”可能造成嚴重后果,因為Whisper當前正被全球多個行業用于翻譯和轉錄采訪內容、生成文本以及為視頻制作字幕。
雖然OpenAI曾警告不應在“高風險領域”使用該工具,但目前一些美國醫療中心都正開始使用基于Whisper的工具,來記錄患者與醫生間的對話。
據經常使用Whisper的研究人員和工程師表示,他們在工作中經常會遇到該工具出現“幻覺”。例如,密歇根大學的一名研究人員在研究公共會議的轉錄準確率時發現,他所審核的每十份音頻轉錄中,便有八份存在“幻覺”。
一位機器學習工程師則稱,在他分析的100多個小時的Whisper轉錄中,他最初發現大約有一半存在“幻覺”。第三位開發人員指出,在他用Whisper創建的26000份記錄中,幾乎每一份都發現了胡編亂造的現象。
即使是在那些錄制良好的簡短音頻樣本里,問題也依然存在。在最近的一項研究中,計算機科學家們在審查的超過13000個清晰音頻片段中發現有187個存在“幻覺”問題。
研究人員表示,這種趨勢將導致在數百萬段錄音中出現數以萬計的錯誤轉錄。
每10份音頻就有8份被胡編 OpenAI語音轉錄工具被曝存重大缺陷
每10份音頻就有8份被胡編 OpenAI語音轉錄工具被曝存重大缺陷
后果嚴重
曾在拜登政府領導白宮科技政策辦公室工作的Alondra Nelson表示,這種錯誤可能會造成“非常嚴重的后果”,尤其是在醫院里。
目前,包括明尼蘇達州的曼卡托診所和洛杉磯兒童醫院在內的超過30000名臨床醫生和40個衛生系統,已開始使用法國AI診療公司Nabla基于Whisper打造的工具。
Nabla公司的首席技術官Martin Raison表示,該工具根據醫學語言進行了微調,以轉錄和總結醫生與病人間的互動。該工具轉錄的就診記錄目前已多達約700萬次。該公司官員還指出,他們知道Whisper會產生幻覺,并正在努力解決這個問題。
目前擔任普林斯頓高等研究院教授的Nelson表示,“沒有人希望出現誤診。(該領域)應該有更高的標準。”
目前,Whisper還被用于為聾人和聽力障礙者制作字幕——這是一個特別容易因出現錯誤轉錄而陷入困境的人群,因為聾人和聽力障礙者完全無法識別“隱藏在所有文本中”的編造內容。
這種幻覺在Whisper中的普遍存在,已促使眾多專家、倡導者和OpenAI前員工呼吁美國政府考慮制定人工智能法規。
他們指出,OpenAI至少需要解決這一缺陷。今年2月因擔心公司的發展方向而從OpenAI辭職的工程師William Saunders就表示,如果OpenAI愿意優先解決這個問題,這個問題似乎是可以解決的。而如果你長期把它放在那里,而人們對它的功能過于自信,并把它集成到所有這些其他系統中,那就有麻煩了。
雖然大多數開發人員都認為轉錄工具不可避免會拼錯單詞或出現其他錯誤,但不少工程師和研究人員表示,他們從未見過其他人工智能轉錄工具像Whisper一樣容易產生幻覺。
目前,該工具已被集成到OpenAI旗艦聊天機器人ChatGPT的某些版本中,同時也是甲骨文和微軟云計算平臺的內置產品,為全球數千家公司提供服務。它還可用于將文本轉錄和翻譯成多種語言。
僅在上個月,開源人工智能平臺HuggingFace上的一個Whisper最新版本就被下載了420多萬次。該平臺的機器學習工程師Sanchit Gandhi表示,Whisper是最流行的開源語音識別模型,從呼叫中心到語音助手,都內置了Whisper。
康奈爾大學教授Allison Koenecke和弗吉尼亞大學教授Mona Sloane,目前已研究了他們從卡內基梅隆大學的研究資料庫TalkBank中獲得的數千個簡短音頻片段。他們發現,近40%的幻聽是有害的或令人擔憂的,因為說話者的原意可能被曲解或歪曲。
研究人員并不確定Whisper和類似工具產生幻覺的原因,但軟件開發人員表示,這些胡編亂造往往發生在出現停頓、背景聲音或音樂播放時。OpenAI此前在網上披露的信息中曾建議,不要在決策情境中使用Whisper,因為準確性上的缺陷會導致結果上的明顯缺陷。
而針對最新爆料,有OpenAI發言人回應稱,OpenAI會在接下來的模型更新中加入相應的反饋機制。
每10份音頻就有8份被胡編 OpenAI語音轉錄工具被曝存重大缺陷
每10份音頻就有8份被胡編 OpenAI語音轉錄工具被曝存重大缺陷


 

(責任編輯:admin)

weixin
推薦內容
評論
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
主站蜘蛛池模板: 亚洲精品视频播放 | 黑人巨大精品欧美一区免费视频 | 亚洲在线影院 | 丰满白嫩老熟女毛片 | 91久久久久久| 福利社午夜影院 | 免费亚洲网站 | 婷婷精品久久久久久久久久不卡 | 成人免费视频 | 久久久久久高清 | 成人免费在线观看网址 | 午夜社区| 欧美精品在线观看 | 亚洲久久久久 | 欧洲亚洲一区 | 中文字幕国产一区二区 | 久久草视频| 在线视频 亚洲 | 黄色一级毛片a | 一级特黄bbbbb免费观看 | 日韩欧美在线免费观看 | 国产毛片视频 | 久久久久久一级片 | 精品伊人久久 | 综合色成人 | av网站免费观看 | 丝袜美腿一区二区三区 | 香蕉yeye凹凸一区二区三区 | 久热免费视频 | 日韩高清在线一区 | 久久精品一 | 成人高清在线 | 国产精品成人av | 看污片网站 | 性吧在线 | 亚洲精品在线视频 | 国产精品一二三区视频 | 黄色一级大片在线免费看产 | 五月婷婷在线观看视频 | 国产精品视频一 | 黄色网址免费观看 |