介紹 std::vector ,并且討論它在 STL 中的算法和條件函數 remove_if()

介紹

這篇文章的目的是為了介紹 std::vector ,如何恰當地使用它們的成員函數等操作。本文中還討論了條件函數和函數指針在迭代算法中使用,如在 remove_if() for_each() 中的使用。通過閱讀這篇文章讀者應該能夠有效地使用 vector 容器,而且應該不會再去使用 C 類型的動態數組了。

Vector 總覽

vector C++ 標準模板庫中的部分內容,它是一個多功能的,能夠操作多種數據結構和算法的模板類和函數庫。 vector 之所以被認為是一個容器,是因為它能夠像容器一樣存放各種類型的對象,簡單地說, vector 是一個能夠存放任意類型的動態數組,能夠增加和壓縮數據。

為了可以使用 vector ,必須在你的頭文件中包含下面的代碼:

# include <vector>

vector 屬于 std 命名域的,因此需要通過命名限定,如下完成你的代碼:

using std::vector;

vector< int > vInts;

或者連在一起,使用全名:

std::vector< int > vInts;

建議使用全局的命名域方式:

using namespace std;

在后面的操作中全局的命名域方式會造成一些問題。 vector 容器提供了很多接口,在下面的表中列出 vector 的成員函數和操作。

Vector 成員函數

函數

表述

c.assign(beg,end)

c.assign(n,elem)

[beg; end) 區間中的數據賦值給 c

n elem 的拷貝賦值給 c

c.at(idx)

傳回索引 idx 所指的數據,如果 idx 越界,拋出 out_of_range

c.back()

傳回最后一個數據,不檢查這個數據是否存在。

c.begin()

傳回迭代器重的可一個數據。

c.capacity()

返回容器中數據個數。

c.clear()

移除容器中所有數據。

c.empty()

判斷容器是否為空。

c.end()

指向迭代器中的最后一個數據地址。

c.erase(pos)

c.erase(beg,end)

刪除 pos 位置的數據,傳回下一個數據的位置。

刪除 [beg,end) 區間的數據,傳回下一個數據的位置

c.front()

傳回地一個數據。

get_allocator

使用構造函數返回一個拷貝。

c.insert(pos,elem)

c.insert(pos,n,elem)

c.insert(pos,beg,end)

pos 位置插入一個 elem 拷貝,傳回新數據位置。

pos 位置插入 n elem 數據。無返回值。

pos 位置插入在 [beg,end) 區間的數據。無返回值。

c.max_size()

返回容器中最大數據的數量。

c.pop_back()

刪除最后一個數據。

c.push_back(elem)

在尾部加入一個數據。

c.rbegin()

傳回一個逆向隊列的第一個數據。

c.rend()

傳回一個逆向隊列的最后一個數據的下一個位置。

c.resize(num)

重新指定隊列的長度。

c.reserve()

保留適當的容量。

c.size()

返回容器中實際數據的個數。

c1.swap(c2)

swap(c1,c2)

c1 c2 元素互換。

同上操作。

vector<Elem> c

vector <Elem> c1(c2)

vector <Elem> c(n)

vector <Elem> c(n, elem)

vector <Elem> c(beg,end)

c.~ vector <Elem>()

創建一個空的 vector

復制一個 vector

創建一個 vector ,含有 n 個數據,數據均已缺省構造產生

創建一個含有 n elem 拷貝的 vector

創建一個以 [beg;end) 區間的 vector

銷毀所有數據,釋放內存。

Vector 操作

函數

描述

operator []

返回容器中指定位置的一個引用。

創建一個 vector

vector 容器提供了多種創建方法,下面介紹幾種常用的。

創建一個 Widget 類型的空的 vector 對象:

vector<Widget> vWidgets;

// ------

// |

// |- Since vector is a container, its member functions

// operate on iterators and the container itself so

// it can hold objects of any type.

創建一個包含 500 Widget 類型數據的 vector

vector<Widget> vWidgets(500);

創建一個包含 500 Widget 類型數據的 vector ,并且都初始化為 0

vector<Widget> vWidgets(500, Widget(0));

創建一個 Widget 的拷貝:

vector<Widget> vWidgetsFromAnother(vWidgets);

vector 添加一個數據

vector 添加數據的缺省方法是 push_back() push_back() 函數表示將數據添加到 vector 的尾部,并按需要來分配內存。例如:向 vector<Widget> 中添加 10 個數據,需要如下編寫代碼:

for (int i= 0;i<10; i++)

vWidgets.push_back(Widget(i));

獲取 vector 中制定位置的數據

很多時候我們不必要知道 vector 里面有多少數據, vector 里面的數據是動態分配的,使用 push_back() 的一系列分配空間常常決定于文件或一些數據源。如果你想知道 vector 存放了多少數據,你可以使用 empty() 。獲取 vector 的大小,可以使用 size() 。例如,如果你想獲取一個 vector v 的大小,但不知道它是否為空,或者已經包含了數據,如果為空想設置為 -1 ,你可以使用下面的代碼實現:

int nSize = v.empty() ? -1 : static_cast < int >(v.size());

訪問 vector 中的數據

使用兩種方法來訪問 vector

1、 vector::at()

2、 vector::operator[]

operator[] 主要是為了與 C 語言進行兼容。它可以像 C 語言數組一樣操作。但 at() 是我們的首選,因為 at() 進行了邊界檢查,如果訪問超過了 vector 的范圍,將拋出一個例外。由于 operator[] 容易造成一些錯誤,所有我們很少用它,下面進行驗證一下:

分析下面的代碼:

vector< int > v;

v.reserve(10);

for ( int i=0; i<7; i++)

v.push_back(i);

try

{

int iVal1 = v[7]; // not bounds checked - will not throw

int iVal2 = v.at(7); // bounds checked - will throw if out of range

}

catch ( const exception& e)

{

cout << e.what();

}

我們使用 reserve() 分配了 10 int 型的空間,但并不沒有初始化。如下圖所示:

你可以在這個代碼中嘗試不同條件,觀察它的結果,但是無論何時使用 at() ,都是正確的。

刪除 vector 中的數據

vector 能夠非常容易地添加數據,也能很方便地取出數據,同樣 vector 提供了 erase() pop_back() clear() 來刪除數據,當你刪除數據的時候,你應該知道要刪除尾部的數據,或者是刪除所有數據,還是個別的數據。在考慮刪除等操作之前讓我們靜下來考慮一下在 STL 中的一些應用。

Remove_if() 算法

現在我們考慮操作里面的數據。如果要使用 remove_if() ,我們需要在頭文件中包含如下代碼::

# include <algorithm>

Remove_if() 有三個參數:

1、 iterator _First :指向第一個數據的迭代指針。

2、 iterator _Last :指向最后一個數據的迭代指針。

3、 predicate _Pred :一個可以對迭代操作的條件函數。

條件函數

條件函數是一個按照用戶定義的條件返回是或否的結果,是最基本的函數指針,或者是一個函數對象。這個函數對象需要支持所有的函數調用操作,重載 operator()() 操作。 remove_if() 是通過 unary_function 繼承下來的,允許傳遞數據作為條件。

例如,假如你想從一個 vector<CString> 中刪除匹配的數據,如果字串中包含了一個值,從這個值開始,從這個值結束。首先你應該建立一個數據結構來包含這些數據,類似代碼如下:

# include <functional>

enum findmodes

{

FM_INVALID = 0,

FM_IS,

FM_STARTSWITH,

FM_ENDSWITH,

FM_CONTAINS

};

typedef struct tagFindStr

{

UINT iMode;

CString szMatchStr;

} FindStr;

typedef FindStr* LPFINDSTR;

然后處理條件判斷:

class FindMatchingString

: public std::unary_function<CString, bool >

{

public :

FindMatchingString( const LPFINDSTR lpFS) : m_lpFS(lpFS) {}

bool operator()(CString& szStringToCompare) const

{

bool retVal = false ;

switch (m_lpFS->iMode)

{

case FM_IS:

{

retVal = (szStringToCompare == m_lpFDD->szMatchStr);

break ;

}

case FM_STARTSWITH:

{

retVal = (szStringToCompare.Left(m_lpFDD->szMatchStr.GetLength())

== m_lpFDD->szWindowTitle);

break ;

}

case FM_ENDSWITH:

{

retVal = (szStringToCompare.Right(m_lpFDD->szMatchStr.GetLength())

== m_lpFDD->szMatchStr);

break ;

}

case FM_CONTAINS:

{

retVal = (szStringToCompare.Find(m_lpFDD->szMatchStr) != -1);

break ;

}

}

return retVal;

}

private :

LPFINDSTR m_lpFS;

};

通過這個操作你可以從 vector 中有效地刪除數據:

// remove all strings containing the value of

// szRemove from vector<CString> vs.

FindStr fs;

fs.iMode = FM_CONTAINS;

fs.szMatchStr = szRemove;

vs.erase(std::remove_if(vs.begin(), vs.end(), FindMatchingString(&fs)), vs.end());

Remove_if() 能做什么?

你可能會疑惑,對于上面那個例子在調用 remove_if() 的時候還要使用 erase() 呢?這是因為大家并不熟悉 STL 中的算法。 Remove(),remove_if( ) 等所有的移出操作都是建立在一個迭代范圍上的,那么不能操作容器中的數據。所以在使用 remove_if() ,實際上操作的時容器里數據的上面的。思考上面的例子:

1、 szRemove = “o”.

2、 vs 見下面圖表中的顯示。

vector介紹

觀察這個結果,我們可以看到 remove_if() 實際上是根據條件對迭代地址進行了修改,在數據的后面存在一些殘余的數據,那些需要刪除的數據。剩下的數據的位置可能不是原來的數據,但他們是不知道的。

調用 erase() 來刪除那些殘余的數據。注意上面例子中通過 erase() 刪除 remove_if() 的結果和 vs.enc() 范圍的數據。

壓縮一個臃腫的 vector

很多時候大量的刪除數據,或者通過使用 reserve() ,結果 vector 的空間遠遠大于實際需要的。所有需要壓縮 vector 到它實際的大小。 resize() 能夠增加 vector 的大小。 Clear() 僅僅能夠改變緩存的大小,所有的這些對于 vector 釋放內存等九非常重要了。如何來解決這些問題呢,讓我們來操作一下。

我們可以通過一個 vector 創建另一個 vector 。讓我們看看這將發生什么。假定我們已經有一個 vector v ,它的內存大小為 1000 ,當我們調用 size() 的時候,它的大小僅為 7 。我們浪費了大量的內存。讓我們在它的基礎上創建一個 vector

std::vector<CString> vNew(v);

cout << vNew.capacity();

vNew.capacity() 返回的是 7 。這說明新創建的只是根據實際大小來分配的空間。現在我們不想釋放 v ,因為我們要在其它地方用到它,我們可以使用 swap() v vNew 互相交換一下?

vNew.swap(v);

cout << vNew.capacity();

cout << v.capacity();

有趣的是: vNew.capacity() 1000 v.capacity() 7

現在是達到我的目的了,但是并不是很好的解決方法,我們可以像下面這么寫:

std::vector<CString>(v).swap(v);

你可以看到我們做了什么?我們創建了一個臨時變量代替那個命名的,然后使用 swap() , 這樣我們就去掉了不必要的空間,得到實際大小的 v


for(int i = 0;i < ClientHotFixList->size();i++)
{
std::string strTemp = ClientHotFixList->at(i);
printf("%s",strTemp.c_str());
}


結論

我希望這個文檔可以給那些使用 STL vector 容器的開發者很有價值的參考。我也希望通過閱讀這篇文章你可以放心地使用 vector 來代替 C 語言中的數據了。

參考

Plauger, P.J. Standard C++ Library Reference. February, 2003. MSDN.

Schildt, Herbert. C++ from the Ground Up, Second Edition. Berkeley: 1998.

Sutter, Herb. More Exceptional C++. Indianapolis: 2002.