edgelist
= [[
'Mannheim'
,
'Frankfurt'
,
85
], [
'Mannheim'
,
'Karlsruhe'
,
80
], [
'Erfurt'
,
'Wurzburg'
,
186
], [
'Munchen'
,
'Numberg'
,
167
], [
'Munchen'
,
'Augsburg'
,
84
], [
'Munchen'
,
'Kassel'
,
502
], [
'Numberg'
,
'Stuttgart'
,
183
], [
'Numberg'
,
'Wurzburg'
,
103
], [
'Numberg'
,
'Munchen'
,
167
], [
'Stuttgart'
,
'Numberg'
,
183
], [
'Augsburg'
,
'Munchen'
,
84
], [
'Augsburg'
,
'Karlsruhe'
,
250
], [
'Kassel'
,
'Munchen'
,
502
], [
'Kassel'
,
'Frankfurt'
,
173
], [
'Frankfurt'
,
'Mannheim'
,
85
], [
'Frankfurt'
,
'Wurzburg'
,
217
], [
'Frankfurt'
,
'Kassel'
,
173
], [
'Wurzburg'
,
'Numberg'
,
103
], [
'Wurzburg'
,
'Erfurt'
,
186
], [
'Wurzburg'
,
'Frankfurt'
,
217
], [
'Karlsruhe'
,
'Mannheim'
,
80
], [
'Karlsruhe'
,
'Augsburg'
,
250
],[
"Mumbai"
,
"Delhi"
,
400
],[
"Delhi"
,
"Kolkata"
,
500
],[
"Kolkata"
,
"Bangalore"
,
600
],[
"TX"
,
"NY"
,
1200
],[
"ALB"
,
"NY"
,
800
]]
?
g = nx.Graph()
for edge in edgelist:
g.add_edge(edge[ 0 ],edge[ 1 ], weight = edge[ 2 ])
?
for i, x in enumerate(nx.connected_components(g)):
print ( "cc" +str(i)+ ":" ,x)
------------------------------------------------------------
cc0: { 'Frankfurt' , 'Kassel' , 'Munchen' , 'Numberg' , 'Erfurt' , 'Stuttgart' , 'Karlsruhe' , 'Wurzburg' , 'Mannheim' , 'Augsburg' }
cc1: { 'Kolkata' , 'Bangalore' , 'Mumbai' , 'Delhi' }
cc2: { 'ALB' , 'NY' , 'TX' }
-
零售:很多客戶使用大量賬戶,可以利用連通分量算法尋找數據集中的不同簇類。假設使用相同信用卡的客戶 ID 存在連邊(edges),或者將該條件替換為相同的住址,或者相同的電話等。一旦我們有了這些連接的邊,就可以使用連通分量算法來對客戶 ID 進行聚類,并對每個簇類分配一個家庭 ID。然后,通過使用這些家庭 ID,我們可以根據家庭需求提供個性化建議。此外,通過創建基于家庭的分組功能,我們還能夠提高分類算法的性能。
-
財務:我們可以利用這些家庭 ID 來識別金融欺詐。如果某個賬戶曾經有過欺詐行為,那么它的關聯帳戶很可能發生欺詐行為。
從鹿特丹到格羅寧根的最短途徑是什么?或者換句話說:從特定城市到特定城市的最短路徑是什么?這便是最短路徑算法,而我只用了二十分鐘就完成了該算法的設計。?一天早上,我和未婚妻在阿姆斯特丹購物,我們逛累了,便在咖啡館的露臺上喝了一杯咖啡。而我,就想著我能夠做到這一點,于是我就設計了這個最短路徑算法。正如我所說,這是一個二十分鐘的發明。事實上,它發表于1959年,也就是三年后。它之所以如此美妙,其中一個原因在于我沒有用鉛筆和紙張就設計了它。后來我才知道,沒有鉛筆和紙的設計的一個優點就是,你幾乎被迫避免所有可避免的復雜性。最終,這個算法讓我感到非常驚訝,而且也成為了我名聲的基石之一。
——Edsger Dijkstra于2001年接受ACM通訊公司 Philip L. Frana 的采訪時的回答
print (nx.shortest_path(g, 'Stuttgart' , 'Frankfurt' ,weight= 'weight' ))
print (nx.shortest_path_length(g, 'Stuttgart' , 'Frankfurt' ,weight= 'weight' ))
--------------------------------------------------------
[ 'Stuttgart' , 'Numberg' , 'Wurzburg' , 'Frankfurt' ]
503
for x in nx.all_pairs_dijkstra_path(g,weight= 'weight' ):
print (x)
--------------------------------------------------------
( 'Mannheim' , { 'Mannheim' : [ 'Mannheim' ], 'Frankfurt' : [ 'Mannheim' , 'Frankfurt' ], 'Karlsruhe' : [ 'Mannheim' , 'Karlsruhe' ], 'Augsburg' : [ 'Mannheim' , 'Karlsruhe' , 'Augsburg' ], 'Kassel' : [ 'Mannheim' , 'Frankfurt' , 'Kassel' ], 'Wurzburg' : [ 'Mannheim' , 'Frankfurt' , 'Wurzburg' ], 'Munchen' : [ 'Mannheim' , 'Karlsruhe' , 'Augsburg' , 'Munchen' ], 'Erfurt' : [ 'Mannheim' , 'Frankfurt' , 'Wurzburg' , 'Erfurt' ], 'Numberg' : [ 'Mannheim' , 'Frankfurt' , 'Wurzburg' , 'Numberg' ], 'Stuttgart' : [ 'Mannheim' , 'Frankfurt' , 'Wurzburg' , 'Numberg' , 'Stuttgart' ]})
( 'Frankfurt' , { 'Frankfurt' : [ 'Frankfurt' ], 'Mannheim' : [ 'Frankfurt' , 'Mannheim' ], 'Kassel' : [ 'Frankfurt' , 'Kassel' ], 'Wurzburg' : [ 'Frankfurt' , 'Wurzburg' ], 'Karlsruhe' : [ 'Frankfurt' , 'Mannheim' , 'Karlsruhe' ], 'Augsburg' : [ 'Frankfurt' , 'Mannheim' , 'Karlsruhe' , 'Augsburg' ], 'Munchen' : [ 'Frankfurt' , 'Wurzburg' , 'Numberg' , 'Munchen' ], 'Erfurt' : [ 'Frankfurt' , 'Wurzburg' , 'Erfurt' ], 'Numberg' : [ 'Frankfurt' , 'Wurzburg' , 'Numberg' ], 'Stuttgart' : [ 'Frankfurt' , 'Wurzburg' , 'Numberg' , 'Stuttgart' ]})
....
-
Dijkstra 算法的變體在 Google 地圖中廣泛使用,用于計算最短的路線。
-
想象身處在沃爾瑪商店,我們知道了各個過道之間的距離,我們希望為從過道 A 到過道 D 的客戶提供最短路徑。
-
如下圖所示,當我們知道了領英中用戶的一級連接、二級連接時,如何得知幕后的信息呢?Dijkstra 算法可以幫到我們。
# nx.minimum_spanning_tree ( g ) returns a instance of type graph
nx.draw_networkx ( nx.minimum_spanning_tree ( g ))
-
最小生成樹在網絡設計中有著最直接的應用,包括計算機網絡,電信網絡,運輸網絡,供水網絡和電網。(最小生成樹最初就是為此發明的)
-
最小生成樹可用于求解旅行商問題的近似解
-
聚類——首先構造最小生成樹,然后使用類間距離和類內距離來設定閾值,從而破壞最小生成樹中的某些連邊,最終完成聚類的目的
-
圖像分割——首先在圖形上構建最小生成樹,其中像素是節點,像素之間的距離基于某種相似性度量(例如顏色,強度等),然后進行圖的分割。
4、網頁排序(Pagerank)
# reading the dataset
fb = nx.read_edgelist( '../input/facebook-combined.txt' , create_using = nx.Graph(), nodetype = int)
pos = nx.spring_layout(fb)
import warnings
warnings.filterwarnings( 'ignore' )
plt.style. use ( 'fivethirtyeight' )
plt.rcParams[ 'figure.figsize' ] = ( 20 , 15 )
plt.axis( 'off' )
nx.draw_networkx(fb, pos, with_labels = False , node_size = 35 )
plt.show()
pageranks = nx.pagerank(fb)
print(pageranks)
------------------------------------------------------
0.006289602618466542, :
1 : 0.00023590202311540972,
2 : 0.00020310565091694562,
3 : 0.00022552359869430617,
4 : 0.00023849264701222462,
........}
?
import operator
sorted_pagerank = sorted(pagerank.items(), key= operator .itemgetter( 1 ), reverse = True )
print (sorted_pagerank)
------------------------------------------------------
[( 3437 , 0.007614586844749603 ), ( 107 , 0.006936420955866114 ), ( 1684 , 0.0063671621383068295 ), ( 0 , 0.006289602618466542 ), ( 1912 , 0.0038769716008844974 ), ( 348 , 0.0023480969727805783 ), ( 686 , 0.0022193592598000193 ), ( 3980 , 0.002170323579009993 ), ( 414 , 0.0018002990470702262 ), ( 698 , 0.0013171153138368807 ), ( 483 , 0.0012974283300616082 ), ( 3830 , 0.0011844348977671688 ), ( 376 , 0.0009014073664792464 ), ( 2047 , 0.000841029154597401 ), ( 56 , 0.0008039024292749443 ), ( 25 , 0.000800412660519768 ), ( 828 , 0.0007886905420662135 ), ( 322 , 0.0007867992190291396 ),......]
?
first_degree_connected_nodes = list(fb.neighbors( 3437 ))
second_degree_connected_nodes = []
for x in first_degree_connected_nodes:
second_degree_connected_nodes+=list(fb.neighbors(x))
second_degree_connected_nodes. remove ( 3437 )
second_degree_connected_nodes = list( set (second_degree_connected_nodes))
subgraph_3437 = nx.subgraph(fb,first_degree_connected_nodes+second_degree_connected_nodes)
pos = nx.spring_layout(subgraph_3437)
node_color = [ 'yellow' if v == 3437 else 'red' for v in subgraph_3437]
node_size = [ 1000 if v == 3437 else 35 for v in subgraph_3437]
plt.style.use( 'fivethirtyeight' )
plt.rcParams[ 'figure.figsize' ] = ( 20 , 15 )
plt.axis( 'off' )
nx.draw_networkx(subgraph_3437, pos, with_labels = False, node_color=node_color,node_size=node_size )
plt.show()
-
已被用于根據引文尋找最具影響力的論文
-
已被谷歌用于網頁排名
-
它可以對推文進行排名,其中,用戶和推文作為網絡的節點。如果用戶 A 跟隨用戶 B,則在用戶之間創建連邊;如果用戶推文或者轉發推文,則在用戶和推文之間建立連邊。
-
用于推薦系統
https://networkx.github.io/documentation/networkx-1.10/reference/algorithms.centrality.html#current-flow-closeness
-
介數中心性: 擁有最多朋友的用戶很重要,而起到橋梁作用、將一個領域和另一個領域進行連接的用戶也很重要,因為這樣可以讓更多的用戶看到不同領域的內容。介數中心性衡量了特定節點出現在兩個其他節點之間最短路徑集的次數。
-
度中心性: 即節點的連接數。
pos = nx.spring_layout(subgraph_3437)
betweennessCentrality = nx.betweenness_centrality(subgraph_3437,normalized=True, endpoints=True)
node_size = [v * 10000 for v in betweennessCentrality.values()]
plt.figure(figsize=(20,20))
nx.draw_networkx(subgraph_3437, pos=pos, with_labels=False,
node_size=node_size )
plt.axis('off')
-
谷歌NIPS論文Transformer模型解讀:只要Attention就夠了
-
阿里云彈性計算負責人蔣林泉:億級場景驅動的技術自研之路
-
開源sk-dist,超參數調優僅需3.4秒,sk-learn訓練速度提升100倍
-
你在北邊的西二旗被水淹沒,我在東邊的八通線不知所措
-
為什么說邊緣計算的發展比5G更重要?
-
C/C++ 最易受攻擊、70% 漏洞無效,揭秘全球開源組件安全現狀
-
首批共享單車死于 2019
-
公鑰加密、加密Hash散列、Merkle樹……區塊鏈的密碼學你知多少?
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
