Google News 排名演算法 - 2013


Google News 的排名演算法是怎麼做的?

主要原文應該是這篇: An inside look at Google's news-ranking algorithm

Google 新聞的排名演算法

下述摘錄自此篇: Google 新聞排名演算法透視

Computerworld 在美國專利辦公室網站查詢時碰巧發現了 Google 去年的一項專利申請—《改進新聞文章排名的演算法與系統》,專利申請號為20120158711。通過對申請文檔的分析,從中可以瞭解到 Google 對新聞故事排名的一些指標。這些指標決定了哪些新聞可以被放在 Google News 的顯著位置。

專利申請中運用了超過 12 項指標來對其他網站的新聞文章進行排名。包括新聞網站定期產生的新聞數量、新聞來源的平均長度、新聞來源新聞報道的重要性、突發新聞得分、使用模式、輿論意見、流通量、相關新聞組織的員工數量、新聞來源的辦事處數量、新聞報道的廣度、新聞中使用的原創命名實體的數量、國際多樣性、甚至還包括寫作風格。

以下就是部分演算法規則

  • 用原創文章數或原創句子數來衡量新聞來源的質量
  • 用“故事規模得分”確定某組織一周、一個月或更長時間撰寫的原創文章的重要性。比方說,如果 D 是關於哥倫比亞航天飛機失事的文章,而相關主題的其他不同文章還有 500 篇,那麼這個故事的規模就是 500
  • 突發新聞得分的計算是通過衡量新聞來源發布重大事件的速度來確定的
  • 而新聞機構(尤其是未受廣泛引用的那些)製作高品質、原創內容的能力,則可以通過故事提及人物的數量等來衡量

由於此前 Google 對新聞文章的熱度評定經常引起媒體公司的爭議,這份文檔也許能澄清部分事實。不過,Google 在電子郵件回復中稱專利申請不代表產品就是這麼做的

相關網頁


關於 Tsung

對新奇的事物都很有興趣, 喜歡簡單的東西, 過簡單的生活.
本篇發表於 News-Google-Yahoo 並標籤為 , , 。將永久鏈結加入書籤。

發表迴響