ChatGPT 背後都需要有「數據標註員」將資料標註正確,才有辦法訓練 AI 得到正確的答案。
人工智慧 後面,還是需要很多 工人智慧 來支持~
- 註:在 ChatGPT 成功的背後,有賴「數據標註員」標記有害的內容
ChatGPT 背後「血汗工廠」的數據
ChatGPT 背後是 OpenAI,而「數據標註」的部份是外包給 Sama 的公司來進行
- OpenAI 在 2021年底 與 Sama 簽署了三份總價值約20萬美元的合約,為數據庫中有害的內容進行標記
- Sama 是一家總部位於美國舊金山的公司,該公司僱傭了肯尼亞、烏干達和印度的外包員工
Sama 作法:
- 大約30多名工作人員被分成三個小組,每個小組都專注於一個主題
- 他們每9個小時要閱讀和標註150~200段文字
- 這些段落的範圍從100個單詞到1000多個單詞不等
- 如此計算,平均每小時他們最多要閱讀和標註超2萬個單詞
- 時薪1.32~2美元,每小時或標註超2萬個單詞
合約規定
- OpenAI 將為該項目向 Sama 支付 每小時12.50美元 的報酬,這是該項目員工時薪的6~9倍
- Sama 為 OpenAI 僱傭的數據標籤員工支付的 時薪在1.32美元~2美元之間(約新台幣39.9元~60.5元),具體取決於資歷和表現
- Sama 員工透露,「代理商」是三個小組中最初級的數據標籤人員,他們的基本工資為每月2.1万肯尼亞先令(約170美元、新台幣5,140元)
- 他們每月還能獲得約70美元的獎金,如果達到準確性和速度等關鍵績效指標,他們還可以獲得佣金
- 按此計算,一名每天工作9小時的員工預計稅後時薪至少能拿1.32美元,如果超額完成所有目標,則最高可達到1.44美元(約新台幣43.5元)
- 質量分析師是資歷更深的數據標籤員工,他們的工作是檢查「代理商」的工作,如果他們達到了所有績效目標,時薪可以拿到2美元
- 公開資料顯示,肯尼亞並沒有統一的最低工資標準,但當這些外包員工受僱時,肯尼亞首都內羅畢的最低時薪是1.52美元
架構大概是這樣:OpenAI → Sama → 代理商(數據標註員) → 質量分析師(資歷更深的數據標籤員工)
上述整理自此篇:ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?
最悲慘的應該是這個:數據工廠裏的標記員:我們訓練人工智能,直到它取代我們