語音icon與語音界面的開發起草

張貼者： Unknown 4月 25, 2011

語音icon與語音界面的開發起草

        用「起草」兩個字其實是要表達還不到proposal的階段，只是先將一個問題提出一個可能的解決方案。

        對於盲人而言，GUI的使用變成了一種障礙，但是我認為這樣的障礙在設計盲人UI時並不表示要取消，因為GUI的使用讓user使用電腦或是手機時更為便利，而我的目的只是在於讓盲人也能便利的使用電腦或手機，而不損及一般人的使用便利性，所以我認為有必要發展語音的icon以及界面。

        目前盲人使用電腦或手機，數字九宮格的使用與用手勢移動游標的功能極為重要，由於盲人無法正常使用華鼠點選icon，所以一次移一格的方式變成比較能夠正確無誤選擇icon的方式。盲人每移動一次游標，系統就會用與音唸出icon的名稱，所以我們應該可以稱盲人聽到的語音回饋是種語音icon。

        一般人使用的視覺icon，它的特性是人們可以使用divided attention去作全面性的搜尋，在使用熟悉的情況下，GUI會比文字更能夠快速的被搜尋，這是視覺icon的使用優勢，但是盲人卻無法在這種優勢中受益，所以我想提出一個語音介面的構想。

        這個發想是源自於認知心理學中的雞尾酒效應，這個效應的意思是，在一個雞尾酒會中，人的交談聲通常都很大聲，但是不管如何吵雜，只要是有人說自己的名字或是熟悉的事物，人就會馬上會在眾多聲音中聽到這樣的資訊。所以我推論只要是熟悉的聲音(帶有語意的)人有能力在吵雜環境中聽出來。

        過去的語音icon，都是把游標移動一格，系統就會語音回饋一次，所以移動一次講一個這樣頗為費時。我目前有兩個構想，第一個是把螢幕上的選項排成每四個一行，就跟現在的智慧型手機一樣，我一次移動一行，語音同時唸出四個選項的應用程式名稱(當然每個選項的聲調不同)，我們可以用四種聲音例如成年男聲為1、成年女聲為2、男孩聲為3、女孩聲為4，如果要找的語音icon是用成年女聲唸出來的，盲人可以回答2，就可以點選自己要的icon。

        第二種方式是，我們不同時唸出四個選項，而是用一點時間差來給予語音回饋，例如第一個icon的頭一個字唸完時，第二個icon就開始唸，以此類推，這樣的方式比較可以省去training的時間，我們可以讓盲人依聽到的先後順序去回答1234。

        至於方向鍵的設計，我結合了兩種方式，一種是iPad遊戲中有出現過的需擬方向鍵，如下圖，只要使用者的指尖由中央往上移動，就是上移，以此類推，另外再加上Mr. Raman的設計，只要手指碰到觸控式螢幕就會把方向鍵的中心自動移到手指點的位置，這樣就可以解決尋找方向鍵的問題。

不過目前這個從認知科學出發的構想，還需要經過一連串的行為實驗分析以及user study，由於目前我本人已經沒有隸屬任何實驗室，明年雖然有打算申請學校但是老實說並沒有太大把握拿獎學金出國，所以如果有讀者覺得這個發想有那麼一點價值，煩請將它發展出來嘉惠盲人朋友，謝謝。

搜尋此網誌

I am Nor Chen

語音icon與語音界面的開發起草

留言

張貼留言

熱門文章

何謂交互作用？

聊聊良民證