為什麼會有這系列文章
以下紀錄幾個我會寫這系列文章的理由:
- 培養長久做一件事情的能力,不因外力因素就中斷。
- 積累實力,打造履歷(學習歷程)。
- 分享、紀錄自己成長過程中,部分運用到的資源。
每日筆記
值得紀錄的道理
第一則
【宇宙洪荒,動靜有常,天象地形,變化始見矣,性情體用,恩害予奪,史更日易,變無窮數矣,坐望崑崙,觀變,習行,遵道,守德。】
第二則
【大成者,不著相,不急於學一方技能。人有陽壽,科技亦然,求科技者,如草原野兔,始量少,繁衍迅速,終無草食。】
第三則
【萬物本無名,有名而定性,生質】
上面幾則皆是老師給我的教導,我非常喜歡接收、省思這些道理。我不怕自己無法理解這些(也覺得自己真的能夠理解,不過運用部分要多練習),只怕沒有機會透過這些資訊知道對方在想什麼。
接續旅行該做的事
【速出,持續修正旅行方式,出發前聯絡外部,告訴他們,有師之命,你在作調查,想訪談錄影。控管預算,不要懼怕失去,山窮水盡之時,亦是他人不能得的體驗。】
根據上述指示,接下來會先找出能夠訪談的對象,預先聯絡,然後前往當地訪談錄影。
這次省思,我也悟了一件事,我可以不怕沒錢,我有後盾,我只怕失去重要之人。
「這不是變弱,而是種進步」
我曾經得到過這樣的提醒。學習如何面對這份畏懼,可能還需要一些時間。有可能一輩子都無法解決,那也沒關係,真的該面對的時候,在學會面對也沒什麼不好,多珍惜當下。
可以訪談的對象
目前想到有機會訪談的對象包括:
- 地方新創中心
- 青年事務局
- 可以產生文化衝擊的人
- 和AI專業領域有相關的人
青年事務局
桃園市政府 – 青年事務局有一項【門診諮詢服務】。根據網頁內容,應該要先進行諮詢申請,然而打開申請連結後,得到是服務整備中。工作日開始後會先試著聯絡 桃園市政府青年事務局 公共參與科的夏先生 (03)4225205 #6003,試著詢問能否進行訪談。
「地方新創中心」和「能夠產生文化衝擊的人」我還在尋找,希望明天能有所收穫。
和AI專業領域有相關專業的人
睡前剛發現「財團法人人工智慧科技基金會」,裡面有許多在AI領域有專業技術和經驗的人,或許可以從中找到能夠訪談的對象。(有看過其他人訪問過其中一兩位工程師。)
關於AI部分可參與的活動
下一個目標可能是花蓮,雖然在花蓮縣政府青年發展中心目前尚未找到訪談機會,但看到6/3有一場【玩數位 創未來】ChatGPT:自媒體的AI賦能的活動能夠參與,已報名,若有規劃花蓮行程再前往參加。
老師對於AI的建議
【人有陽壽,科技亦然,求科技者,如草原野兔,始量少,繁衍迅速,終無草食。】
【你在網路上學的AI已是過去的產物,已有新的AI,然新AI,很快又成了舊AI。】
文中表明追求科技的人,就像草原上的野兔一樣。一開始雖然少,但成長繁衍的非常迅速,最終,會沒有草吃而亡,代表找不到工作。
【萬物本無名,有名而定性,生質,嘗試去寫一段對質化與量化的理解。】
關於質化與量化的理解,將在其他地方敘述。
我理解這是走AI領域最重要的事。AI最關鍵的要素是如何把看似難以數學化的東西數學化,這是熟知各種AI模型、數學、技巧都不一定能夠習得的能力。
也就是:
【嘗試用生活案例對應到線性代數中的向量與矩陣,如何描述一個人,一群人。】
先不論什麼模型建立、如何訓練、如何優化,上述三個過程不過是一堆的矩陣、向量運算。最重要的是把「概念」寫成矩陣、向量這類可以算的東西。
網路上「質化」的定義:
【以主觀的方式來瞭解任何標的的真實現象,不以數字來探討標的,再以個人之見解來進行探討後結果的解釋分析,以獲得質化資料的結果】
我想先舉物理領域的例子,在物理學發展過程中,並不是所有的進展都是先有理論,才做實驗驗證。
在古人了解行星如何運動之前,只是單純地將觀察到的軌跡、數據紀錄下來,才對這些數據做解釋。根據數據,古時候的學者提出一些自己的主觀意見,解釋為什麼會有這些數據,我認為這是「質化的其中一種方式」。
物理的例子可能不是那麼的正確且有點抽象,所以我享用人類學的例子來補充。
在研究人類學的過程中,我們會收集「和訪談者的對話內容」,這每一筆內容,皆是「訪談者根據主觀意識做出的描述」,是一筆質化資料,而學者根據這些資料,以自己的主觀意識或經驗寫下見解,這是另一筆質化資料(是質化「已經質化過的資料」的資料)。
質化有很多方式,總歸來說是根據個人的主觀意識、觀點、經驗來分析一件事、一份資料、一個看到的事實等。訪談的內容,其實就是一筆質化的資料。(或許這是要我做訪談的理由?我不確定。)
當我對一支筆作出「這支筆很漂亮」的敘述,這就是一筆質化過的資料。
網路上「量化」的定義:
【對自然物理現象或人文社會現象,採數值衡量或以數據說明的過程,稱為「量化」。】
關於量化,我想先提一段曾經的經歷。在中央物理實驗課時,一開始對於實驗結果的描述方式,非常的「定性」。學生常說「有點高」、「比較多,比較少」等,我認為也是一種質化的內容。但好的敘述方式應該是「數值為xxx,與xxx相比少了xxx」,這樣的敘述在物理研究報告上才是有意義的。
當我說出「這裡有十支筆」,十支就是一筆量化過的資料。
若我對質化過的資料賦予數值,則質化資料就被量化了。
把質化的資料量化,寫成數學中矩陣、向量的形式,經由演算法(一堆的數學運算)找出能夠給予符合真實分布輸出的目標函數,是自然語言處理最核心的觀念,也是大多AI模型在做的事。