鄭昀 20070723
China Web2.0 Review <chsdate isrocdate="False" islunardate="False" day="22" month="7" year="2007" w:st="on">7<span lang="EN-US" style="FONT-FAMILY: 楷體_GB2312; mso-ascii-font-family: Verdana"><span lang="EN-US">月</span></span>22<span lang="EN-US" style="FONT-FAMILY: 楷體_GB2312; mso-ascii-font-family: Verdana"><span lang="EN-US">日</span></span></chsdate> 講到了我們玩聚( Onejoo: Memetracker in China ),從敘事邏輯上看,算是很懂 memeTracker 的了,我于是在下面留言說(shuō)了我們的在第一階段的第一回合構(gòu)建的最新進(jìn)展。
非常感謝他們勉勵(lì)的話: “
Overall, Onejoo seems to be the first memetracker in Chinese Internet market, we hope they can be successful, and become a perfect example of successfully copying ideas from overseas by being innovative and taking advantage of knowing the Chinese market better.” 。
我和 張俊林張博士 從去年 9 月到現(xiàn)在已經(jīng)努力了 11 個(gè)月了,時(shí)間很長(zhǎng)了,左沖右突之下,也算是積累了堅(jiān)實(shí)的文本挖掘技術(shù)基礎(chǔ)和較高的壁壘。《 中國(guó)的克隆公司能夠引領(lǐng)創(chuàng)新嗎? 》論述了善于克隆的中國(guó)公司應(yīng)該如何處理用戶量與技術(shù)支持 比例 的問(wèn)題,我們過(guò)去也一直在致力于解決這些問(wèn)題,當(dāng)然我們考慮的還不是訪問(wèn)網(wǎng)站的用戶量問(wèn)題,而是如何針對(duì)數(shù)以百萬(wàn)計(jì)的博客甚至是數(shù)以萬(wàn)計(jì)的論壇、數(shù)以萬(wàn)計(jì)的新聞源進(jìn)行實(shí)時(shí)的大規(guī)模文本挖掘計(jì)算,并且以某種方式找到萬(wàn)事萬(wàn)物之間的關(guān)系。
我們最近構(gòu)建的 http://www.onejoo.com 【update:8000的版本切換到了默認(rèn)端口,按照 http://www.onejoo.com 訪問(wèn)即可】/ 這么一個(gè) “not alpha - not beta - just not done yet” 版本,是 HotSpot Engine (熱點(diǎn)自動(dòng)發(fā)現(xiàn)) +Connections Engine (關(guān)聯(lián)引擎) +Topic Engine (主題引擎)的三位一體。
HotSpot Engine 每日監(jiān)視 3 百萬(wàn)之多的博客,自動(dòng)計(jì)算出熱點(diǎn)和對(duì)話,生成基礎(chǔ)數(shù)據(jù)的熱點(diǎn)故事,譬如說(shuō): 從旁觀者角度看搜狐 PK 三大門戶 和 北京電視臺(tái)真的瘋了! 和 超女的素質(zhì)在何處?粉絲的 原則 在哪里? 。
Connections Engine 找到熱點(diǎn)故事、人、組織之間的關(guān)聯(lián)并展現(xiàn)出來(lái)遠(yuǎn)近程度,譬如說(shuō):文本挖掘就能自動(dòng)找到 章子怡 這個(gè)人為何和 艾維 · 尼沃夫 有這么近的關(guān)系呢,和 高楓 有關(guān)系呢,和 李涿生 ,和 張藝謀 的關(guān)系并體現(xiàn)出來(lái),這個(gè) idea 和 News.com.com 的 The Big Picture 差不多 。
Topic Engine 欲組織某一個(gè)主題的幾乎所有的微內(nèi)容聚合,目前只是 Blogsophere 的,包括 Blog 中的評(píng)論回復(fù),譬如說(shuō): 張杰 和 朱廣滬 。
以上僅僅是我們第一階段的第一回合,按照 “ 微內(nèi)容聚合 ” 的路子完成 memeTracker 的第一步,很快下一階段我們會(huì)推出一個(gè)創(chuàng)新的個(gè)性化閱讀和推薦的體系,我們不僅僅會(huì)克隆,還會(huì)創(chuàng)造,呵呵。
China Web2.0 Review 是一個(gè)主要關(guān)注中文的 Web2.0 應(yīng)用及服務(wù)的發(fā)展動(dòng)態(tài)的 blog ,同時(shí)也追蹤那些中國(guó)互聯(lián)網(wǎng)大公司的動(dòng)態(tài)。最開(kāi)始的 contributor 有 Luyi Chen 和 Tangos (有名的 " 未完成 " )以及 幾個(gè) guesting bloggers 。
相關(guān)閱讀:
1 : 個(gè)性化閱讀的過(guò)去和未來(lái)【一】 個(gè)性化閱讀的過(guò)去和未來(lái)【二】 個(gè)性化閱讀的過(guò)去和未來(lái)【三】 鄭昀
2 : 玩聚熱點(diǎn)新發(fā)現(xiàn) – 中國(guó)的 techmeme 鄭昀
3 : News is Still a Wide Open Game
4 : Who Will Bring Us News: Robots, Crowds, or Editors
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
