Common Voice Explorer —— 聆聽世界各地的聲音

如果你曾好奇成千上萬段真實人聲聽起來是什麼樣的——不同的年齡、口音、語言——那麼有一個資料集正好滿足你。它叫做 Mozilla Common Voice，是世界上最大的開源錄音語音合集之一。

來自世界各地的人們自願朗讀句子並捐獻自己的錄音。其成果是一個龐大的、多語言的真實語音庫——任何人都可以自由使用。

只有一個問題：真正去瀏覽它卻很難。

資料集很龐大，工具卻跟不上

Common Voice 包含數百萬段音訊片段，涵蓋數十種語言。要查看它，你通常需要下載數 GB 的資料，撰寫指令稿來解析中繼資料檔案，並架設自己的播放流程。如果你是開發者，這沒什麼問題，但它把其他所有人都擋在了門外——研究人員、語言學家、產品團隊，以及那些只想聽聽資料是什麼樣的好奇者。

我們覺得這是一個被錯過的機會。

Common Voice Explorer 是一個簡單的網頁工具，讓你直接在瀏覽器中瀏覽這個資料集。無需下載，無需指令稿，無需設定。

Common Voice Explorer — 在瀏覽器中直接搜尋、篩選並聆聽片段

你可以做這些事情：

它的設計就像瀏覽一個音樂庫，只不過你瀏覽的不是歌曲，而是來自世界各地真實人們的真實語音。

老實說——給任何對語音資料感到好奇的人。

你不需要懂技術就能使用它。只要你會用搜尋框、會點擊播放，就沒問題。

在 WaveKat，我們正在為小型企業打造語音 AI 工具。這項工作仰賴於高品質的語音資料。Common Voice 是這一領域最重要的開源資源之一，我們相信讓它變得更易於存取會讓所有人受益——而不僅僅是工程師。

開放資料只有在人們能真正去瀏覽它時才有價值。這正是我們想要填補的空白。

Common Voice Explorer 已上線，網址是 commonvoice-explorer.wavekat.com。用 GitHub 登入，接受使用條款，即可開始瀏覽。

如果你想先看看它的實際效果，還有一段簡短的 YouTube 示範。