機器人的“Blog Network”
1、 Icebin的困惑
其他的延展閱讀:
施于人: icebin為什么要困惑
詹臏: 關于blogbeta,postshow,ofblog與blog network ?
誰來經營Blognetwork
博客士:
Blog的商業體現需要包工頭?
老冒: blogging network: 如何維持統一和持久的品牌價值?
Icebin: 也談Blog媒體
?
這么出來的東西,不就是 機器人的“Blog Network” 嗎?
http://www.flickr.com/photos/zhengyun/293060731/
????? 百度、Google是通過用戶搜索輸入的關鍵詞來判斷中文世界的熱點。而我們通過分析博客們寫作的數十萬篇博文來尋找熱點的。通過這種主題自動發現技術,可以很容易知道最近中文世界人們在討論什么、在關注什么。而不需要任何人為的輸入關鍵詞來做第一推動力。
譬如說,如下所示的熱點組:
-----------
主題
245------------------
??????
核心文檔:
(index=11646507.xml)
新快報:韓國人發明漢字
??????
index=11645945.xml
??
title=
如何拯救我們的文化?
??????
index=11645979.xml
??
title=
看看韓國對中國犯的七宗罪
(
隨時更新
)
??????
index=11647900.xml
??
title=
漢字真是韓國人發明的又能怎樣(圖)
??????
index=11651176.xml
??
title=
韓國人為什么敢意淫漢字?
??????
index=11654537.xml
??
title=
韓國人瘋了宣稱“漢字是古代韓國人發明的”!
-----------
主題
246------------------
??????
核心文檔:
(index=11646015.xml)
財經新聞報道的創新
??????
index=11645987.xml
??
title=
財經新聞與“利益”視角――財經報道心得點滴談
??????
index=11646003.xml
??
title=
我們怎么寫財經新聞
??????
index=11646009.xml
??
title=
美國華人記者看中國財經報紙――《華爾街日報》成長的啟示
??????
index=11646031.xml
??
title=
國外財經媒體的啟示:大眾化還是專業化
??????
index=11646037.xml
??
title=
需要財經大視野――新形勢下經濟報道的新特點分析
可以表明人們在討論兩個熱點:“韓國人是否發明了漢字的爭論”和“財經新聞如何制作的分析”。
目前,這種計算將會每天計算一次。未來希望能夠半天計算一次,這就對爬蟲速度以及熱點計算速度提出了很高的要求。
"想知道在最近三小時內中文博客們在熱烈討論什么嗎?"
那就看我們的“Most Popular”頻道吧。
Technorati.com依靠url鏈接來計算最流行的熱點排行榜(Most Popular: http://www.technorati.com/pop/ ),在中國不可能完全根據鏈接計算熱點,只能靠語義。
?
早先的swordi這篇blog也談到了類似的意思不過提到的這些都是人手動作的專題并且人有意識提取在先。其實機器可以自己去發現去整理。
{
中文網志年會歸來的Blog回響:編輯2.0的時代已經來臨
http://swordi.com/2006/11/04
看起來Technorati.com在中國大陸是無法訪問了:( 國內的Souyo.com有些差強人意,收錄Post的速度滯后很嚴重,在杭州參加 中文網志年會 的第二天訪問 Souyo.com開設的中文網志年會的專題頁面 ,發現沒有新鮮的內容。
今年有許多人在做手工編輯的網志年會內容聚合,例如博客報的Blo
這個簡單的體驗,也說明Blog的發展在2006