294678435_446090520862018_6232736940010257544_n

我的AI生活日記(01)

這個A I生活日記,是想記錄我結合寫App專業來開發「專屬A I助理」的過程。

先介紹一下自己:我是一名有十多年經驗的App軟體工程師,雙修iOS與Android(咳咳咳是迫於生活才學這麼多把戲),目前這計劃先以iOS為主。

● 我的專屬助理Ai

開頭我就直說了,我的終極目標,是做出像鋼鐵人的管家賈維斯那樣的A I。嗯……理想很肉感,現實很骨感,目前主客觀與最先進技術都沒有那樣的條件能做到,哪怕是一成。所以先建立近程目標就好,那就是,讓A I打理我的生活。

想像一下,你起床後打開電腦,A I像早餐店老闆娘那樣叫你帥哥❤️跟你熱情打招呼,順便關心你,前天你跟女友吵架有沒有和好,順便查好可以送什麼包包,或者講什麼甜言蜜語。還幫你統計這兩個月,你們為了哪些事吵架。(首先,你得先有個女友…)

再來提醒你,離同學會越來越近,你是主辦,接下來還有哪些事要做,還有該繳瓦斯費跟卡費了。最後送上一份清單,已經整理好這兩天你必須要,以及可能要做的事。接近中午你不知道要吃什麼,問A I,他給了你幾個選擇,有你自己輸入說要吃的,有幾個是他根據你喜好找了附近餐廳候選。

等你吃完中飯休息的時候,A I突然找你,要討論上次你說的idea,還有你之前說要學,他給了你一份學習資源清單跟建議,並排好學習步驟。

我要做的事情,差不多就像這樣,而且這些目前是能做到。至於幫忙研發鋼鐵衣,就未來看看吧😏。

● 發表方式

1. 這個日記我想讓一般人都看得懂,不講程式內容,盡量讓他有趣啦~你可以留言發問,我盡量回答,照著細節你有技術也能做到,但是別跟我要程式碼啦。

2. 這件事很簡單嗎?不,一點也不簡單,這中間需要克服很多困難點,以及跟體重成反比的錢包,以後慢慢讓大家知道。

3. 這件事跟App專業有什麼關係?當然有,因為你總是要一個能呈現的介面,用網頁會有很多限制,只有App能做到兼顧行動與速度,並且在手機與電腦上都能執行。

目前已經做了一些實驗,踩部份雷之後也有了點成果。原本在開始寫之前,想好好規劃,並且一開局就要拍影片。只是每次如果要詳細規劃,都會讓計畫拖延好久。擇期不如撞日,乾脆就從中間開始寫吧,反正一開始應該也不會有人看😳?

噢對了,本文超過九成是我用「口述」寫出來的,再經過部分人工修飾。沒事,這跟A I沒直接關係。只是在說,我在自己寫的筆記App裡加上iOS語音辨識,以及一些便利編輯的功能來快速寫文章。這個App之後也會提到,因為整個A I助理,都是在這個筆記App呈現(而且就有很多現成資料讓A I參考)。

● 本文開始(?

最後來講這兩天做的事,提醒一下我是從中間開始講,前面有些細節跟成果,以後再慢慢聊。

首先我們要知道一件事情,A I大語言模型即使再強大也沒能力「直接」控制你的電腦或App 。A I回答的東西,就只是一串文字,再來必須透過你預先寫好的溝通規格,執行你要的功能。就像是他給了App一紙公文,App從上面的指示,繼續執行接下來的功能。

目前我在自己的App,加上了語音辨識,我想要口語化講出事情後要A I分類並記錄。

開啟語音並不難,語音辨識也是由iOS內建函式庫來執行(辨識正確率大概七成左右),遇到的第一個困難,就是在辨識當中如何知道你講的話已經結束了?這不是單純的停了兩秒就當結束了,因為有可能需要思考,需娓娓道來。而人與人聊天,我們是從經驗判斷對方講的話結束了沒(也是有嘰哩呱啦講不停無法插話的人)。ChatGPT語音聊天強大之處,就是他已經能判斷你話講完了沒,甚至讓你插話。我當然沒這技術,也無法在自己的App使用他們的功能。退而求其次,我在辨識完成之後,還是要由自己按下執行鍵(博杯問AI啦)。

● 目前成果

接下來,我在送出問句同時,加上一些預先寫好的prompt(可理解為指示),這樣A I才能照我要的方式回答。我要他回答的不是文字,而是組成一個Json格式的內容。你不用知道什麼叫Json,就想成是剛剛講的公文,上面會有幾個欄位,裡面的值才是我要判斷的東西,如同底下照片範例,A I由ChatGPT擔綱,我就只講一句「我後天需要繳電費」:


當你看到照片,就知道為什麼我不要A I直接回答就好。我要他在判斷我的語句之後,判斷是什麼分類,以及拆分需要的開始與截止日,還有後面要做什麼事。因為後面App還要執行寫入功能。

並且A I判斷完之後,也需要做確認才能執行,我也怕A I發瘋亂執行功能,搞成天網😱。後面會列出我目前規劃好的分類與給A I的promt指示,大概就是行程,記錄發生事件,未來要注意的點,要吃的餐廳,臨時想到的東西或idea,想要深入學習的主題。

另外大語言模型,我也有在自己的Mac電腦安裝了一個,底下執行範例是臉書推出的Llama3大模型70b的版本,多數情況下是能照指示做出答案,但偶爾不太穩,就像這例子就沒給出開始日與截止日,可能是因為prompt指示太多吧。照片如下:

● 分類與Prompt(指示)

另外我秀一下目前的prompt:

這邊有個小細節,我在前面講的promt指示一開頭加上今天的日期,是因為我提到了「後天」,ChatGPT會自動判斷出後天的日期,但在自己電腦上面執行的模型,會以他的出廠日(訓練資料截止日)當成「今天」。

喔還有,我用ChatGPT大概2秒就回傳結果,用自己裝的大模型,需要快一分鐘OMG(但如果已經載入過大模型沒被從記憶體清掉,下一次使用大概只需12秒)。所以要選哪一種很清楚,剩下的問題就是錢了😩。

總之,我想要能在拿起手機,按一個按鈕口述事情, A I回答完我確認按鈕,寫入資料庫。當你輸入足夠多之後, A I就能幫你規劃或是提醒。

下一步就是執行存入資料庫的功能,有問題底下發問喔~

【一抹墨痕】
喜歡分享文字,不跟風,不腥羶色,不灑狗血。只講有溫度的東西~
(網頁右上角可追蹤臉書、IG跟脆)

Share the Post:

 

關於留言:為防垃圾廣告,第一次留言會需要審核,通過之後便不用再審核喔~

發表迴響

 

 

 

本網站是一抹墨痕的文字園地,除了這裡,還有臉書粉絲團每天寫「乾話集」,內容以輕鬆詼諧為主,請大家去按讚啦❤️~

內容(可點擊分類):

乾話集:臉書每日乾話集的精華。
日記:不會每天寫,但會言之有物。
其他還有一些想寫的文章,以及為了流量貼的東西😏(咦?

對了,請大家踴躍留言,第一次留言會需要審核(避免垃圾詐騙),第二次同樣帳號就不用審核。

公告1:新網站弄了一個多月,終於上線啦。

返回頂端