為什麼會有這系列文章 以下紀錄幾個我會寫這系列文章的理由: 培養長久做一件事情的能力,不因外力因素就中斷。 積累實力,打造履歷(學習歷程)。 分享、紀錄自己成長過程中,部分運用到的資源。 每日筆記 前言 今天一共有以下幾個主題: 質化型變量與量化型變量 質化型變量如何轉為量化型變量、量化工具的合理性 結論一個人要正常運作的要件 Radio Commander的遊玩影片(第一、二關) 前天的New Question 前兩個主題比較偏技術討論、分享,後三個主題則是一些思維、心得或生活上的分享。 質化型變量與量化型變量 區分質化型變量和量化型變量,關鍵在於是否具有數值上的順序或大小關係。質化型變量只是描述不同的類別或屬性,而量化型變量則具有可測量和計算的數值特性。 質化型變量(Qualitative Variables) 也稱為類別變量或分類變量,表示觀察單位的特定屬性或類別。質化型變量沒有數值上的順序或大小關係,只是用來描述類別或屬性。 例如:性別、婚姻狀態、地區、學歷等都是質化型變量。 量化型變量(Quantitative Variables) 也稱為連續變量或數值變量,表示觀察單位的具體數值。量化型變量可以進行數值上的比較和計算。根據度量層次的不同,可以進一步分為兩類: 離散變量(Discrete Variables):取有限個或可數個數值的變量,通常表示計數或次數。例如:家庭成員人數、每月用戶註冊數量等都屬於離散變量。 連續變量(Continuous Variables):可以取任意數值的變量,可以是整數或小數。例如:身高、體重、年齡、收入、時間、距離等都屬於連續變量。 總結 質化型變量只是描述不同的類別或屬性,而量化型變量則具有可測量和計數的數值特性。區分質化型變量和量化型變量的關鍵,在於是否具有數值上的順序或大小關係。 質化型變量轉為量化型變量 將質化型變量轉為量化型變量最關鍵的要素,是要讓質化型變量在數值上具備順序或大小關係,而決定數值順序或大小則要套上「情境」。 直接舉例:將顧客滿意度(質化型變量)轉化為量化型變量。顧客滿意度通常以評分或評價形式表示,例如「非常滿意」、「滿意」、「一般」、「不滿意」、「非常不滿意」等。為了進行「數值分析或比較」,我們可以將顧客滿意度轉化為數字表示。 在顧客滿意度情境中,我們將滿意視為「大、強」,不滿意視為「小、弱」,因此不同滿意度代表的數值就具有大小和順序性了。 另一個例子:教育程度教育程度通常分為「高中以下」、「大學」、「碩士」、「博士」等。我們可以用0-3根據不同情境需求,套給他們不同的數值。 假設情境是要分析「是否具備較專業的知識」,那博士變量的數值可以給3,設為最大,高中以下可以給0,設為最低,因為情境的出現,質化型變量被套上數值後,也具備順序和大小的特性。 另一個例子:顏色一種顏色常見的轉化方式是將顏色使用數字編碼,例如使用RGB(紅綠藍)色彩模型的數值表示。,將每個顏色分別映射到0到255的範圍內(0-255, 0-255, 0-255)。具備較多或較少「紅」、「綠」、「藍」,就成了情境。因此賦予的數值,具備了大小的特性。 小結:要將質化型變量轉為量化型變量,一定脫離不了賦予數值,而通常數值具備有無、順序或大小的特性。 轉化工具 轉化工具有很多種,在評估轉化工具的合理性上可以考慮以下幾個方面: 目標符合性:轉化工具是否能夠達到所設定的目標和需求。例如,是否能夠準確地將質化型變量轉化為合適的量化型變量。 可靠性:轉化工具是否能產生「一致」和可靠的結果。評估可靠性可以通過測和驗證來進行,例如使用不同的數據樣本進行評估,檢查轉化結果的一致性和穩定性。 適用性:轉化工具是否適用於特定的情境和目標。不同的質化型變量可能需要不同的轉化方法和工具。評估轉化工具的適用性時,需要考慮質化型變量的特性和應用場警,並選擇最合適的轉化方法。 可解釋性:轉化工具產生的量化結果是否能夠被解釋和理解。在機器學習模型中,可解釋性是一個重要的考量因素。評估轉化工具的可解釋性時,需要確保轉化結果能夠清晰地表達質化型變量的特點和含義。 相關性:轉化工具產生的量化結果是否與質化型變量具有相關性。評估轉化工具的相關性可以通過統計分析和相關性測量來進行,確定轉化結果與原始質化型變量之間的關聯程度。 一般來說,選擇和使用轉化工具時,需要綜合考慮這些評估標準,確保轉化工具的合理性和有效性。 常見的轉化工具包括: 獨熱編碼(One-Hot Encoding):將每個類別轉換為一個二進制特徵,使得每個類別都有自己的特徵列。這種轉化方式常用於處理多類別分類問題。 數值編碼(Numeric Encoding):將類別映射為一個數值,可以使用類別的頻率、軍職、中位數等統計數據做為數值編碼的依據。 順序編碼(Ordinal …
2023/5/31 每日筆記 Read More »