簡(jiǎn)介
有時(shí)候需要確定一篇新聞文本的地名,比如
上海市實(shí)施了垃圾分類...
其地名,即歸屬地是上海,本工具就是實(shí)現(xiàn)這個(gè)功能的。
給定一篇文章,可包含標(biāo)題和正文(或僅標(biāo)題,僅正文),確定其 歸屬地 (地名)。
-
結(jié)果標(biāo)準(zhǔn):
- 區(qū)分國(guó)內(nèi)國(guó)外,
- 國(guó)外到國(guó)家名一級(jí)
- 國(guó)內(nèi)到省市一級(jí)
安裝
- 使用 python3
$ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .
使用方法
樣例1
import
loc_reg
title
=
'湖南2018年度企業(yè)環(huán)境信用評(píng)價(jià)公示 39家企業(yè)擬被評(píng)“不良”'
passage
=
'今天,記者從湖南省生態(tài)環(huán)境廳獲悉,我省2018年度企業(yè)環(huán)境信用評(píng)價(jià)擬定結(jié)果正在長(zhǎng)沙市進(jìn)行公示,擬評(píng)定環(huán)境誠(chéng)信企業(yè)31家、環(huán)境合格企業(yè)1247家、環(huán)境風(fēng)險(xiǎn)企業(yè)121家、環(huán)境不良企業(yè)39家。'
print
(
loc_reg
.
predict
(
title
,
passage
)
)
結(jié)果為:
{
'國(guó)內(nèi)'
:
[
{
'省'
:
'湖南'
,
'市'
:
'長(zhǎng)沙'
}
]
}
樣例2
passage
=
'近日,布魯塞爾爆發(fā)了大規(guī)模罷工游行,城市服務(wù)、商店、餐飲店均受到影響,原因和歐盟稅收等政策有關(guān)。'
print
(
loc_reg
.
predict
(
passage
)
)
結(jié)果為:
{
'國(guó)外'
:
[
'比利時(shí)'
]
}
說(shuō)明
- 從輿情新聞數(shù)據(jù)中隨機(jī)抽取 100 篇自測(cè),正確率 93%。其他類型文本未測(cè)試,效果待定。
如果覺(jué)得好用,請(qǐng) follow 我一下 https://github.com/dongrixinyu
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
