Linux中的File_operations結(jié)構(gòu)體
2008-07-07 12:34
File_operations結(jié)構(gòu)體
?????? file_operation就是把系統(tǒng)調(diào)用和驅(qū)動(dòng)程序關(guān)聯(lián)起來的關(guān)鍵數(shù)據(jù)結(jié)構(gòu)。這個(gè)結(jié)構(gòu)的每一個(gè)成員都對應(yīng)著一個(gè)系統(tǒng)調(diào)用。讀取file_operation中相應(yīng)的函數(shù)指針,接著把控制權(quán)轉(zhuǎn)交給函數(shù),從而完成了Linux設(shè)備驅(qū)動(dòng)程序的工作。
??? 在系統(tǒng)內(nèi)部,I/O設(shè)備的存取操作通過特定的入口點(diǎn)來進(jìn)行,而這組特定的入口點(diǎn)恰恰是由設(shè)備驅(qū)動(dòng)程序提供的。通常這組設(shè)備驅(qū)動(dòng)程序接口是由結(jié)構(gòu)file_operations結(jié)構(gòu)體向系統(tǒng)說明的,它定義在include/linux/fs.h中。
傳統(tǒng)上, 一個(gè) file_operation 結(jié)構(gòu)或者其一個(gè)指針稱為 fops( 或者它的一些變體). 結(jié)構(gòu)中的每個(gè)成員必須指向驅(qū)動(dòng)中的函數(shù), 這些函數(shù)實(shí)現(xiàn)一個(gè)特別的操作, 或者對于不支持的操作留置為 NULL. 當(dāng)指定為 NULL 指針時(shí)內(nèi)核的確切的行為是每個(gè)函數(shù)不同的。
在你通讀 file_operations 方法的列表時(shí), 你會(huì)注意到不少參數(shù)包含字串 __user. 這種注解是一種文檔形式, 注意, 一個(gè)指針是一個(gè)不能被直接解引用的用戶空間地址. 對于正常的編譯, __user 沒有效果, 但是它可被外部檢查軟件使用來找出對用戶空間地址的錯(cuò)誤使用。
注冊設(shè)備編號(hào)僅僅是驅(qū)動(dòng)代碼必須進(jìn)行的諸多任務(wù)中的第一個(gè)。首先需要涉及一個(gè)別的,大部分的基礎(chǔ)性的驅(qū)動(dòng)操作包括 3 個(gè)重要的內(nèi)核數(shù)據(jù)結(jié)構(gòu),稱為 file_operations,file,和 inode。需要對這些結(jié)構(gòu)的基本了解才能夠做大量感興趣的事情。
??? struct file_operations是一個(gè)字符設(shè)備把驅(qū)動(dòng)的操作和設(shè)備號(hào)聯(lián)系在一起的紐帶,是一系列指針的集合,每個(gè)被打開的文件都對應(yīng)于一系列的操作,這就是file_operations,用來執(zhí)行一系列的系統(tǒng)調(diào)用。
??? struct file代表一個(gè)打開的文件,在執(zhí)行file_operation中的open操作時(shí)被創(chuàng)建,這里需要注意的是與用戶空間inode指針的區(qū)別,一個(gè)在內(nèi)核,而file指針在用戶空間,由c庫來定義。
??? struct inode被內(nèi)核用來代表一個(gè)文件,注意和struct file的區(qū)別,struct inode一個(gè)是代表文件,struct file一個(gè)是代表打開的文件
struct inode包括很重要的二個(gè)成員:
dev_t?????? i_rdev?? 設(shè)備文件的設(shè)備號(hào)
struct cdev *i_cdev 代表字符設(shè)備的數(shù)據(jù)結(jié)構(gòu)
struct inode結(jié)構(gòu)是用來在內(nèi)核內(nèi)部表示文件的.同一個(gè)文件可以被打開好多次,所以可以對應(yīng)很多struct file,但是只對應(yīng)一個(gè)struct inode.
File_operations的數(shù)據(jù)結(jié)構(gòu)如下:
struct module *owner
第一個(gè) file_operations 成員根本不是一個(gè)操作; 它是一個(gè)指向擁有這個(gè)結(jié)構(gòu)的模塊的指針. 這個(gè)成員用來在它的操作還在被使用時(shí)阻止模塊被卸載. 幾乎所有時(shí)間中, 它被簡單初始化為 THIS_MODULE, 一個(gè)在 <linux/module.h> 中定義的宏.
loff_t (*llseek) (struct file *, loff_t, int);
llseek 方法用作改變文件中的當(dāng)前讀/寫位置, 并且新位置作為(正的)返回值. loff_t 參數(shù)是一個(gè)"long offset", 并且就算在 32位平臺(tái)上也至少 64 位寬. 錯(cuò)誤由一個(gè)負(fù)返回值指示. 如果這個(gè)函數(shù)指針是 NULL, seek 調(diào)用會(huì)以潛在地?zé)o法預(yù)知的方式修改 file 結(jié)構(gòu)中的位置計(jì)數(shù)器( 在"file 結(jié)構(gòu)" 一節(jié)中描述).
ssize_t (*read) (struct file *, char __user *, size_t, loff_t *);
用來從設(shè)備中獲取數(shù)據(jù). 在這個(gè)位置的一個(gè)空指針導(dǎo)致 read 系統(tǒng)調(diào)用以 -EINVAL("Invalid argument") 失敗. 一個(gè)非負(fù)返回值代表了成功讀取的字節(jié)數(shù)( 返回值是一個(gè) "signed size" 類型, 常常是目標(biāo)平臺(tái)本地的整數(shù)類型).
ssize_t (*aio_read)(struct kiocb *, char __user *, size_t, loff_t);
初始化一個(gè)異步讀 -- 可能在函數(shù)返回前不結(jié)束的讀操作. 如果這個(gè)方法是 NULL, 所有的操作會(huì)由 read 代替進(jìn)行(同步地).
ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *);
發(fā)送數(shù)據(jù)給設(shè)備. 如果 NULL, -EINVAL 返回給調(diào)用 write 系統(tǒng)調(diào)用的程序. 如果非負(fù), 返回值代表成功寫的字節(jié)數(shù).
ssize_t (*aio_write)(struct kiocb *, const char __user *, size_t, loff_t *);
初始化設(shè)備上的一個(gè)異步寫.
int (*readdir) (struct file *, void *, filldir_t);
對于設(shè)備文件這個(gè)成員應(yīng)當(dāng)為 NULL; 它用來讀取目錄, 并且僅對文件系統(tǒng)有用.
unsigned int (*poll) (struct file *, struct poll_table_struct *);
poll 方法是 3 個(gè)系統(tǒng)調(diào)用的后端: poll, epoll, 和 select, 都用作查詢對一個(gè)或多個(gè)文件描述符的讀或?qū)懯欠駮?huì)阻塞. poll 方法應(yīng)當(dāng)返回一個(gè)位掩碼指示是否非阻塞的讀或?qū)懯强赡艿? 并且, 可能地, 提供給內(nèi)核信息用來使調(diào)用進(jìn)程睡眠直到 I/O 變?yōu)榭赡? 如果一個(gè)驅(qū)動(dòng)的 poll 方法為 NULL, 設(shè)備假定為不阻塞地可讀可寫.
int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
ioctl 系統(tǒng)調(diào)用提供了發(fā)出設(shè)備特定命令的方法(例如格式化軟盤的一個(gè)磁道, 這不是讀也不是寫). 另外, 幾個(gè) ioctl 命令被內(nèi)核識(shí)別而不必引用 fops 表. 如果設(shè)備不提供 ioctl 方法, 對于任何未事先定義的請求(-ENOTTY, "設(shè)備無這樣的 ioctl"), 系統(tǒng)調(diào)用返回一個(gè)錯(cuò)誤.
int (*mmap) (struct file *, struct vm_area_struct *);
mmap 用來請求將設(shè)備內(nèi)存映射到進(jìn)程的地址空間. 如果這個(gè)方法是 NULL, mmap 系統(tǒng)調(diào)用返回 -ENODEV.
int (*open) (struct inode *, struct file *);
盡管這常常是對設(shè)備文件進(jìn)行的第一個(gè)操作, 不要求驅(qū)動(dòng)聲明一個(gè)對應(yīng)的方法. 如果這個(gè)項(xiàng)是 NULL, 設(shè)備打開一直成功, 但是你的驅(qū)動(dòng)不會(huì)得到通知.
int (*flush) (struct file *);
flush 操作在進(jìn)程關(guān)閉它的設(shè)備文件描述符的拷貝時(shí)調(diào)用; 它應(yīng)當(dāng)執(zhí)行(并且等待)設(shè)備的任何未完成的操作. 這個(gè)必須不要和用戶查詢請求的 fsync 操作混淆了. 當(dāng)前, flush 在很少驅(qū)動(dòng)中使用; SCSI 磁帶驅(qū)動(dòng)使用它, 例如, 為確保所有寫的數(shù)據(jù)在設(shè)備關(guān)閉前寫到磁帶上. 如果 flush 為 NULL, 內(nèi)核簡單地忽略用戶應(yīng)用程序的請求.
int (*release) (struct inode *, struct file *);
在文件結(jié)構(gòu)被釋放時(shí)引用這個(gè)操作. 如同 open, release 可以為 NULL.
int (*fsync) (struct file *, struct dentry *, int);
這個(gè)方法是 fsync 系統(tǒng)調(diào)用的后端, 用戶調(diào)用來刷新任何掛著的數(shù)據(jù). 如果這個(gè)指針是 NULL, 系統(tǒng)調(diào)用返回 -EINVAL.
int (*aio_fsync)(struct kiocb *, int);
這是 fsync 方法的異步版本.
int (*fasync) (int, struct file *, int);
這個(gè)操作用來通知設(shè)備它的 FASYNC 標(biāo)志的改變. 異步通知是一個(gè)高級(jí)的主題, 在第 6 章中描述. 這個(gè)成員可以是NULL 如果驅(qū)動(dòng)不支持異步通知.
int (*lock) (struct file *, int, struct file_lock *);
lock 方法用來實(shí)現(xiàn)文件加鎖; 加鎖對常規(guī)文件是必不可少的特性, 但是設(shè)備驅(qū)動(dòng)幾乎從不實(shí)現(xiàn)它.
ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *);
ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *);
這些方法實(shí)現(xiàn)發(fā)散/匯聚讀和寫操作. 應(yīng)用程序偶爾需要做一個(gè)包含多個(gè)內(nèi)存區(qū)的單個(gè)讀或?qū)懖僮? 這些系統(tǒng)調(diào)用允許它們這樣做而不必對數(shù)據(jù)進(jìn)行額外拷貝. 如果這些函數(shù)指針為 NULL, read 和 write 方法被調(diào)用( 可能多于一次 ).
ssize_t (*sendfile)(struct file *, loff_t *, size_t, read_actor_t, void *);
這個(gè)方法實(shí)現(xiàn) sendfile 系統(tǒng)調(diào)用的讀, 使用最少的拷貝從一個(gè)文件描述符搬移數(shù)據(jù)到另一個(gè). 例如, 它被一個(gè)需要發(fā)送文件內(nèi)容到一個(gè)網(wǎng)絡(luò)連接的 web 服務(wù)器使用. 設(shè)備驅(qū)動(dòng)常常使 sendfile 為 NULL.
ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
sendpage 是 sendfile 的另一半; 它由內(nèi)核調(diào)用來發(fā)送數(shù)據(jù), 一次一頁, 到對應(yīng)的文件. 設(shè)備驅(qū)動(dòng)實(shí)際上不實(shí)現(xiàn) sendpage.
unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
這個(gè)方法的目的是在進(jìn)程的地址空間找一個(gè)合適的位置來映射在底層設(shè)備上的內(nèi)存段中. 這個(gè)任務(wù)通常由內(nèi)存管理代碼進(jìn)行; 這個(gè)方法存在為了使驅(qū)動(dòng)能強(qiáng)制特殊設(shè)備可能有的任何的對齊請求. 大部分驅(qū)動(dòng)可以置這個(gè)方法為 NULL.
int (*check_flags)(int)
這個(gè)方法允許模塊檢查傳遞給 fnctl(F_SETFL...) 調(diào)用的標(biāo)志.
int (*dir_notify)(struct file *, unsigned long);
這個(gè)方法在應(yīng)用程序使用 fcntl 來請求目錄改變通知時(shí)調(diào)用. 只對文件系統(tǒng)有用; 驅(qū)動(dòng)不需要實(shí)現(xiàn) dir_notify.
scull 設(shè)備驅(qū)動(dòng)只實(shí)現(xiàn)最重要的設(shè)備方法. 它的 file_operations 結(jié)構(gòu)是如下初始化的:
struct file_operations scull_fops = {
.owner = THIS_MODULE,
.llseek = scull_llseek,
.read = scull_read,
.write = scull_write,
.ioctl = scull_ioctl,
.open = scull_open,
.release = scull_release,
};
這個(gè)聲明使用標(biāo)準(zhǔn)的C標(biāo)記式結(jié)構(gòu)初始化語法. 這個(gè)語法是首選的, 因?yàn)樗跪?qū)動(dòng)在結(jié)構(gòu)定義的改變之間更加可移植, 并且, 有爭議地, 使代碼更加緊湊和可讀. 標(biāo)記式初始化允許結(jié)構(gòu)成員重新排序; 在某種情況下, 真實(shí)的性能提高已經(jīng)實(shí)現(xiàn), 通過安放經(jīng)常使用的成員的指針在相同硬件高速存儲(chǔ)行中.
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
