20200720
語音辨識軟體初探
名稱 | 開發商 | 地區 | 作業系統 | 費用 | 心得/備註 |
Google | 美國 | API | 前60分鐘免費,之後$0.006/15秒 | 需上傳檔案 | |
微軟 | 美國 | API | 語音轉文字: NT$30.055/小時 | 需上傳檔案 | |
訊飛 | 中國 | API/iOS/Android | 套餐一:¥88,10小時,一年 套餐二:¥980,200小時,一年 套餐三:¥3900,1000小時,一年 套餐四:¥10500,3000小時,一年 | 需上傳檔案 | |
訊飛 | 中國 | 網頁 | ¥0.33 /分 | 需上傳檔案 推薦! | |
百度 | 中國 | API/iOS/Android | 前10小時免費,之後¥3 /小時 | 為實時語音辨識(透過麥克風) | |
騰訊 | 中國 | API | ¥90,60小時,一年 | 需上傳檔案 | |
IBM | 美國 | API | $0.01~0.02/分鐘 | 需上傳檔案 | |
布丁布丁吃什麼? | 台灣 | 網頁 | 免費 | 可以線上直接讀取youtube影片,速度與影片時常一樣 | |
Raryel C. Souza |
| 軟體(有免安裝版) | 免費 | 需上傳檔案,速度非常快 | |
Kapwing |
| 網頁 | 免費 | 可以線上直接讀取youtube影片 |
Web speech to text | Kapwing |
需安裝Virtual Audio Cable作為輔助 | X |
X | 需創立帳戶 |
可直接下載srt檔 | 下載srt檔需升級付費 |
Google Web Speech API |
|
★以下用影片進行測試(錯誤以紅底表示):
大家好:好久不見!這是秀豪教授給大家的問候,希望大家一切平安!!!
https://www.youtube.com/watch?v=za_XCu3k_Pw&feature=youtu.be
時長:2:15 特色:中文(有一些英文)、日常用語
| Web speech to text | Kapwing |
轉換時間 | 2分14秒 | 46秒 |
嗨 各位OCW線上的讀者好 剛才錄了非常非常嚴肅的這個open education consortium的影片現在可 | 線上的獨子好剛才入了非常非常嚴肅的 歐爸就可以享受神的影片現在可 | k2線上的肚子好像太露了非常非常嚴肅的這個openeducation生的影片現在可 |
以用母語然後很生動活潑跟大家打個招呼 那我知道最近COVID-19最近的疫情其實在全球非常非常的 | 以用母語然後很生動活潑跟他打個招呼那我就要跟那個最近的夜間接在全球的 | 以用母語然後很生動活潑跟他打個招呼啊我知道咖啡廳最近的一間接在全球量的 |
嚴重 不知道大家是不是還是很快樂在學習呢 身為老師我們其實事實上也是非常的頭痛過去 | 嚴重不知道他是不是還是很快樂在學習呢老師我們其實上也非常的頭痛過去 | 嚴重不知道他是不是還是很快樂在學習呢三個老師我們其實質上也非常的痛過去 |
雖然其實有各式各樣不同數位學習的一些經驗但真正到了完全沒有辦法跟學生即 | 雖然其實有各式各樣不同事為學習的一些經驗但真正到了完全沒有辦法跟學生解 | 雖然其實有各式各樣不同數位學習的一些經驗但真正到了完全沒有辦法跟學生解 |
時有面對面的互動的時候雖然我們嘗試的像是說在youtube直播變紅了或者是說 | 析有面對面的互動的時候雖然我們常識的像是說YouTube來就直播變網紅了 | 析有面對面的互動的時候這樣我們嘗試的像是說在youtube直播網紅了或者是說 |
直接指引重新再重新規劃過去OCW的課程但總覺得就是說在整個學期的教學下來之後也才 | 姊姊直營重新再重新規劃過去ok的課程總覺得就是整個學期的相學下來之後也才 | 直接直營重新再重新規劃過去我的課程但總覺得就是整個學期的相學下來之後才 |
慢慢發現到雖然藉由錄OCW雖然過去其實在數位學習這一塊上面其實有些耕耘 | 慢慢發現到雖然只有如何計算過去其實在說學習這一塊上面其實有些耕耘 | 慢慢發現到雖然只有如果掉給我算過去其實在說學習這一塊上面其實有些耕耘 |
那也藉此認識很多人影響了一些人但是其實人跟人之間面對面的互動還是非常非常的 | 那也只認識很多人影響了一些人其實人跟人之間面對面的互動還是被用量 | 那也藉此認識很多人影響了一些人但是其實人跟人之間面對面的互動還是不用這 |
珍貴的所以希望大家即便在 當然 各位 如果是在台灣的話可能不會特別感到疫情很嚴重 | 珍貴的最希望他即便在當然各位在的位置在台灣的話可能不會特別感受到一點很嚴重 | 樣珍貴的所以希望他即便在的位置是在台灣的話可能不會特別感受到一點很嚴重 |
但我現在處於全世界各地的合作者其實他們真的真的是很辛苦呢對他們來講這個世界根本是完全不 | 但我現在處於全世界各地的合作者其他們真的真的是很辛苦呢對他們來講這個世界根本是完全不 | 但我現在處於全世界各地的作者其他們真的真的是很辛苦呢再來講這個是完全不 |
一樣所以鼓勵大家其實有些時候可以去看一看世界不同的角落目前生活的樣態是長什麼 | 一樣其實有些時候可以去看一看世界不同的角落目前生活的樣態是長什麼 | 一樣所以他其實有些時候可以去看一看世界不同的角落幕前生活的樣才是長什麼 |
樣子那當然也希望也希望大家其實在這樣的一個比較艱困的時期底下也可以勇敢的去規劃 | 樣子那當然也希望也希望他其實在這樣的一個比較艱困的時間可以勇敢的去規劃 | 樣子那當然也希望也希望他現在這樣的一個比較艱困的時期也可以勇敢的去規劃 |
自己的人生然後不要停下學習的腳步這樣那在這邊還是很感謝大家其實過去一開始 | 自己的人生不要停下學習的腳步調那在這邊還是很感謝大家其實過去一開始 | 自己的人生然後不要停下學習的腳步這樣那在這邊還是很感謝他其實過去一開始 |
在錄開放式課程的時候從來沒有想到過會能夠跟這麼多的人有互動影響了這麼多 | 在路開放式課程的時候從來沒有想到過會能夠跟這麼多的人有互動影響了這麼多 | 在陸開放式課程的時候從來沒有想到過會能夠跟這麼多的人有互動影響了這麼多 |
人的人生這是真心話 | 人的人生這是真心話 | 人的人生真的 |
所以如果你偶爾看到我在OCW有什麼講錯話的地方那就多多海涵囉最後的話呢就跟 |
| 所以如果你有看到我在我現在有什麼講錯話的地方那就多多哈囉最後的話呢就跟 |
大家分享一下其實之前的學生寫給我謝謝你的卡片那我的心意也是一樣謝謝大家 | 學生R寫給我謝謝你的卡片那我的心意也是一樣謝謝大家 | 他分享一下其實之前的學生寫給我謝謝你的卡片那我的心也是一樣謝謝大家 |
評語 | 錯誤、漏字很多,英文基本上讀不出來。中間有一段讀得很準,後面卻有一段直接不見 | 錯誤、漏字很多,英文基本上讀不出來。沒有辦法直接下載srt的話,字幕要用複製貼上的一個一個上非常麻煩,時間軸也要自己對。 |
l 兩者辨識的結果都差強人意,即使辨識的是完全日常用語的影片錯誤和漏字的狀況也非常多,不推薦做為字幕使用。
l 兩者之間Kapwing的結果較為準確,速度也較快,但無法免費下載字幕檔
★其他利用官網上有的免費試用測試:
微軟 | 非常嚴肅的這個歐呠Atkinson的影片現在可以用母語,然後很生動活潑跟大家打招呼內,我知道King最近的疫情其實在全球非常非常的嚴重,不知道大家是不是還是很快樂在學習呢?誒,身為老師,我們其實事實上也非常的頭痛,過去雖然其實有各式各樣不同數位學習的一些經驗,但真正到了完全沒有辦法跟學生即使有面對面誒互動的時候。 雖然我們嘗試的像是說在yuto就是直撥變網紅了,或者說誒,直接指引重新再嗯,在規劃過去歐斯y的課程,但總覺得就是說在這一整個學期的教學下來之後,哎也才慢慢發現到,雖然藉由luong過去其實在數位學習這一塊,上面其實有一些耕耘,那也藉此認識很多人,影響了一些人。 但是其實人跟人之間面對面的互動還是非常非常珍貴,弟,所以希望大家即便在,當然各位在尤其在臺灣的話,可能不會特別感受到一件很嚴重,但我現在處於全世界各地的合作者,其實他們真的真的是很辛苦的,在對他們來講,這個世界根本是完全不一樣,所以鼓勵大家,其實有些時候可以去看一看世界不同的角落,目前生活的樣態是長什麼樣子呢?當然也希望。 也希望大家其實在這樣的一個比較。 |
騰訊 | 影片现在可以用母语,然后很生动活泼,跟大家打个招呼,那我知道科比Nike最近的疫情其实在全球非常非常的严重,那不知道大家是不是还是很快乐,在学习呢,呃,三位老师,我们其实事实上也非常的头痛,过去,虽然其实有各式各样不同是为了学习的一些经验,但真正到了完全没有办法跟学生其实有面对面的互动的时候,虽然我们尝试的像是说啊,在UTV就直播变网红了,或者说,哎,直接指引,然后重新再呃,Rio就重新再规划过去OC战队的课程。但总觉得就是说在这一整个学期的教学下来之后,哎,也才慢慢。 |
訊飛聽見 (接近90%正確!) |
|
pyTranscribe | 各位線上的肚子好剛才路了非常非常嚴肅的這個open就可以享受神的影片現在費用我女兒很生動活潑跟他打個招呼那我知道跟那個最近的夜間接在全球這樣的嚴重腦不知道他是不是還是很快樂再學老師我們74上也非常的頭痛過去雖然其實有各式各樣不同視為學習的一些經驗但真正到了完全沒有辦法跟學生這些有面對面的互動的雖然我們常識人像是說YouTube好啦會說一直接直營重新載Vr在規劃過去的課程但總覺得就是這一整個學期的相學下來之後也才慢慢發現到雖然九如我見過去其實在說一學習這一塊上面其實有些耕耘那也藉此認識很多人影響了一些人但是其實人跟人之間面對面的互動珍貴的最希望他即便在當然各位在如果是在台灣的話可能不會特別感受到1點嚴重但我現在還處於全世界各地址給他們真的真的是很辛苦呢對他們來講這個世界根本是完全不一樣這其實有些時候可以去看看世界不同的角落目前生活的樣態是長什麼樣子那當然也希望答其實在質量與比較艱困的時期也可以勇敢的桂華街不要停下學習在這邊還是很感謝大家其實過去一開始的路開放式課程從來沒有想到過慧能夠跟這麼多的人互動影響了這麼多人的申請且如果你有看到我在我想要有什麼講錯話的地方那就多多囉這話呢就跟他分享一下以前的學生R寫給我謝謝你的卡片那我的心意也是一樣謝謝大家 |
★整體下來:
訊飛聽見>Kapwing>web speech to text>微軟>騰訊>pyTranscribe
後來我有用訊飛聽見去測試另一個影片:
10820吳尚鴻資料庫概論_第9F講 Transaction Management I Concurrency Control
由於中英文混雜加上專有名詞多,辨識度下降,但準確率也算蠻高的,有60%以上正確。我使用的是試用版,如果是正式版好像可以選擇中英文混雜辨識,還可以選領域(教育、科技等等),準確率有望提升!
其他音訊軟體
名稱 | 開發商 | 費用 | 支援語言 | 備註 |
Adobe | NT$672 / 月 | 繁體中文等等 | 付費首選 缺點:複雜 | |
訊連科技 | NT$3,980 | 繁體中文等等 |
| |
| 免費開源 | 繁體中文等等 | 免費首選 免費軟體中功能最齊全的 | |
GoldWave Inc | $45 買斷 $15 / 年 | 繁體中文等等 | 介面較為陽春 | |
ocenaudio | 免費 | 簡體中文、英文等等 | 有免安裝版 |
l 大部分的音訊編輯軟體只有剪輯合併功能,需要到調整波形降躁等等功能的話,介面就會複雜許多