ChatGPT 背後「血汗工廠」的數據 - 2023

ChatGPT 背後都需要有「數據標註員」將資料標註正確,才有辦法訓練 AI 得到正確的答案。

人工智慧 後面,還是需要很多 工人智慧 來支持~

  • 註:在 ChatGPT 成功的背後,有賴「數據標註員」標記有害的內容

ChatGPT 背後「血汗工廠」的數據

ChatGPT 背後是 OpenAI,而「數據標註」的部份是外包給 Sama 的公司來進行

  1. OpenAI 在 2021年底 與 Sama 簽署了三份總價值約20萬美元的合約,為數據庫中有害的內容進行標記
  2. Sama 是一家總部位於美國舊金山的公司,該公司僱傭了肯尼亞、烏干達和印度的外包員工

Sama 作法:

  • 大約30多名工作人員被分成三個小組,每個小組都專注於一個主題
  • 他們每9個小時要閱讀和標註150~200段文字
  • 這些段落的範圍從100個單詞到1000多個單詞不等
  • 如此計算,平均每小時他們最多要閱讀和標註超2萬個單詞
  • 時薪1.32~2美元,每小時或標註超2萬個單詞

合約規定

  • OpenAI 將為該項目向 Sama 支付 每小時12.50美元 的報酬,這是該項目員工時薪的6~9倍
  • Sama 為 OpenAI 僱傭的數據標籤員工支付的 時薪在1.32美元~2美元之間(約新台幣39.9元~60.5元),具體取決於資歷和表現
    • Sama 員工透露,「代理商」是三個小組中最初級的數據標籤人員,他們的基本工資為每月2.1万肯尼亞先令(約170美元、新台幣5,140元)
    • 他們每月還能獲得約70美元的獎金,如果達到準確性和速度等關鍵績效指標,他們還可以獲得佣金
    • 按此計算,一名每天工作9小時的員工預計稅後時薪至少能拿1.32美元,如果超額完成所有目標,則最高可達到1.44美元(約新台幣43.5元)
      • 質量分析師是資歷更深的數據標籤員工,他們的工作是檢查「代理商」的工作,如果他們達到了所有績效目標,時薪可以拿到2美元
  • 公開資料顯示,肯尼亞並沒有統一的最低工資標準,但當這些外包員工受僱時,肯尼亞首都內羅畢的最低時薪是1.52美元

架構大概是這樣:OpenAI → Sama → 代理商(數據標註員) → 質量分析師(資歷更深的數據標籤員工)

上述整理自此篇:ChatGPT背後「血汗工廠」:時薪40、每小時標註2萬單詞,數據標註員有多慘?

最悲慘的應該是這個:數據工廠裏的標記員:我們訓練人工智能,直到它取代我們

作者: Tsung

對新奇的事物都很有興趣, 喜歡簡單的東西, 過簡單的生活.

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料