【AI 漫畫】日本 NHK AI 特夯!逐字稿生成、影像色彩化、手語動畫一手包辦

【AI 漫畫】日本 NHK AI 特夯!逐字稿生成、影像色彩化、手語動畫一手包辦
▲NHK 放送技術研究所全力投入 AI 應用研究。(圖/翻攝自 Rodrigo Reyes Marin/アフロ)

吳佳臻/綜合報導

因應人力短缺,以及迎接 2020 年東京奧運,NHK 放送技術研究所(簡稱 NHK 技研)全力投入 AI 應用研究,除了先前由杯緣子姊妹 AI 擔任深夜新聞主播外,還推出逐字稿生成、影像色彩化、手語動畫等系統,領導傳播媒體業邁向新時代。

▲逐字稿生成系統。(圖/翻攝自 NHK,下同)

根據《每日新聞》報導,NHK 技研運用 AI 語音辨識技術,正在開發逐字稿生成系統。過去 NHK 針對大量的採訪影像,為了方便影像編輯和確認,往往需要人工聽打逐字稿,無庸置疑是相當沒效率的工作,近年則開始採用自動化系統。

然而,為了應對多樣化的收音環境和條件,NHK 技研將過去約 3 千個小時份的節目和 1 千 5 百小時的採訪影像的音源,加上各自的文本,交給 AI 學習,藉以提高逐字稿生成系統的精確度。

儘管目前語音辨識系統開發尚未完全,仍需要人工修正,但是的確能夠大幅提升效率,即時支援千變萬化、講求時效的新媒體環境,也改善人員作業負擔。

▲影像色彩化。

製作紀錄片、深度報導節目,總是會運用到早期的黑白影像,為了呈現更真實的效果,多會選擇將之色彩化。就算只有短短 5 秒鐘的小片段,靠一個一個影格慢慢上色,還是需要花費數日的時間。

但是只要讓 AI 學習大量的影像,就能使其將同樣場景的色彩直接複製,大量減縮作業時間。而色彩化後的影像,再經過時代考據專家的檢查與修正,就能呈現最真實的資訊。

▲手語動畫系統。

此外,為了讓聽覺障礙者也能享受節目的樂趣,針對體育轉播也正在研究手語 CG 動畫系統。儘管日本多數節目都可以開啟字幕功能,但是對於先天性聽障者來說,他們的母語是手語,無法跟上日語字幕的速度。

而該手語動畫系統,事先針對賽事常用情況設置好模板,轉播過程中只要填入選手名字、比數等變數即可;再搭配上動態捕捉技術,變成即時生成有如真人手語般的 CG 動畫。也適用於氣象報導等具有一定形式的內容。

NHK 技研表示,目前手語翻譯者稀少,自然無法應對 24 小時的節目。負責人也表示,即時手語翻譯是透過人體來表現,無法長時間進行,相信該系統能減輕相關從業人員的工作負擔。

留言

延伸閱讀