亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python二進制文件讀取并轉換為浮點數詳解

系統 2414 0

本文所用環境:

Python 3.6.5 |Anaconda custom (64-bit)|

引言

由于某些原因,需要用python讀取二進制文件,這里主要用到struct包,而這個包里面的方法主要是unpack、pack、calcsize。詳細介紹可以看:Python Struct 官方文檔。這里主要討論,python二進制轉浮點數的操作。

python中一個float類型的數占4個字節。

二進制數據轉float,可以用struct.unpack()來實現。

小文件讀取

較小的文件,可以一次讀取:

首先導入所需的包:

            
import numpy as np
import struct
Python
          

例如:我需要讀取一個名為filename,存放著形狀為[100,1025]的浮點數的文件。可以采用以下辦法

            
# 加載測試數據
f = open('filename','rb')
# 102500為文檔中包含的數字個數,而一個浮點數占4個字節
data_raw = struct.unpack('f'*102500,f.read(4*102500))
f.close()
verify_data = np.asarray(verify_data_raw).reshape(-1,1025)
          

大文件處理方法

我需要處理的文件大小有38.1G,存放著[10000000,1025]大小的向量。

關于大文件的處理,我參考了這文章,但是,這個方法不能很好的將二進制文件轉換成浮點數。

所以我想到了另外一種辦法:

通過Linux命令切割文件

通過split命令將38.1G的文件按照指定大小切割,

            
split -b 820000k -a 2 filename data_ 
          

上述代碼的意思是,指定每塊大小為820000k,-a 2代表2位數命名,‘data_'代表前綴是'data_'

最終生成49個文件(字典序 aa ?C bw),前48個文件每個204800行 最后一個文件 169600行

通過python循環讀取文件

首先構建詞匯表:

            
voc = ['a','b','c','d','e','f','g','h','i','j','k','l',
'm','n','o','p','q','r','s','t','u','v','w','x',
'y','z']
voc_short = ['a','b','c','d','e','f','g','h','i','j','k','l',
'm','n','o','p','q','r','s','t','u','v']
          

為了方便讀取,將49個二進制文件轉換成numpy專用二進制格式*.npy

            
for i in voc:
data_name = 'data_a'+str(i)
f = open(data_name,'rb')
data_raw = struct.unpack('f'*209920000,f.read(4*209920000))
f.close()
data = np.asarray(data_raw).reshape(-1,1025)
np.save(data_name+'.npy',data) # 保存data_a*.npy文件
for i in voc_short:
data_name = 'data_b'+str(i)
f = open(data_name,'rb')
data_raw = struct.unpack('f'*209920000,f.read(4*209920000))
f.close()
data = np.asarray(data_raw).reshape(-1,1025)
np.save(data_name+'.npy',data) # 保存data_b*.npy文件
data_name = 'data_bw'
f = open(data_name,'rb')
data_raw = struct.unpack('f'*173840000,f.read(4*173840000))
np.save(data_name+'.npy',data_raw) # 保存data_bw.npy文件
          

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 中文国产成人久久精品小说 | 久久久久夜色精品波多野结衣 | 老司机午夜视频在线观看 | 九九九网站 | 成人国产一区二区三区精品 | 久热精品视频在线 | 国产伊人网 | 高清亚洲综合色成在线播放放 | 欧美国产一区二区二区 | 久久久久久草 | ww.久久 | 日本一级aaaa特黄毛片 | a在线观看| 久久伊人免费视频 | 成人影院在线免费观看 | 欧美另类精品 | 97影院97伦里片 | 国产精品自拍亚洲 | 丁香午夜婷婷 | 国产成人精品s8sp视频 | 伊人国产在线 | 亚洲男人的天堂久久无 | 日日操视频 | 正在播放久久 | 高清视频一区二区 | 日日爱影视| 2020国产免费久久精品99 | 久久国产三级 | 纯欧美一级毛片_免费 | 99热热久久这里只有精品8 | 搡女人视频免费 | 日本a一级毛片免费观看 | 一区二区三区精品国产欧美 | 欧美日韩一区二区在线观看 | 日本涩涩网站 | 亚洲国产精品久久久久久 | 九天玄帝诀免费完整观看 | 久久中文字幕一区二区三区 | 欧美另类成人 | 国产尤物| 日韩中文字幕精品一区在线 |