婷婷综合久久中文字幕,狠狠色噜噜狠狠狠狠av,中文字幕日本乱码仑区在线

有朋友問到：
“我需要得到一個web page的title，因為這個title一般都比較靠前，只要取得html 的前面少量內容就可以了。因為要取得很多個頁面的title,如果下載整個html code，肯定比較浪費時間。.net好像沒有現成的類可以干這件事情(取得部分html) ，我應該如何去實現？”
一種比較"廉價"(即較小成本條件下)的解決思路：
第一步：取出含有頁面title部分的最小集合。這是“廉價”的關鍵！
第二步：用正則表達式取出<title>和</title>之間的部分即可。
先看下效果：

下面我們來分析：
頁面title 一般都在靠近開始處，所以我們從開始讀取Stream流，（如果靠近結尾，則如何？）讀取到什么地方為止呢？有個比較明顯的標志是
</title>
遇到它結束就可以了。
以什么方式讀取，我這里選取的是：逐行讀取，取到標志符即終止。
方法如下：

#region 獲取所需要的頁面內容 /// <summary> /// 獲取所需要的頁面內容 by tony 2009.9,16 /// 邀月(downmoon)：3w@live.cn /// <param name="strUrl">所要查找的遠程網頁地址</param> /// <param name="timeout">超時時長設置，一般設置為8000</param> /// <param name="enterType">是否輸出換行符，0不輸出，1輸出文本框換行</param> /// <param name="EnCodeType">編碼方式</param> /// <returns></returns> public static string GetRequestString(string strUrl, int timeout, int enterType, Encoding EnCodeType) { if (strUrl.Equals("about:blank")) return null; ; if (!strUrl.StartsWith("http://") && !strUrl.StartsWith("https://")) { strUrl = "http://" + strUrl; } string strResult = string.Empty; System.IO.StreamReader sr = null; string temp = string.Empty; try { HttpWebRequest myReq = (HttpWebRequest)HttpWebRequest.Create(strUrl); myReq.Timeout = timeout; myReq.UserAgent = "User-Agent:Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 2.0.40607; .NET CLR 1.1.4322; .NET CLR 3.5.30729)"; myReq.Accept = "*/*"; myReq.KeepAlive = true; myReq.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5"); HttpWebResponse HttpWResp = (HttpWebResponse)myReq.GetResponse(); if (HttpWResp.StatusCode == System.Net.HttpStatusCode.OK) { StringBuilder strBuilder = new StringBuilder(); Stream myStream = HttpWResp.GetResponseStream(); sr = new StreamReader(myStream, EnCodeType); string tmp = string.Empty; while ((temp = sr.ReadLine()) != null) { strBuilder.Append(temp); //if has </title> then end by <a title="邀月工作室" href="http://blog.csdn.net/downmoon/" mce_href="http://blog.csdn.net/downmoon/" >歡迎與邀月交流,net技術與軟件架構</a>(邀月）2009.9.16 tmp = strBuilder.ToString(); if (tmp.IndexOf("</title>") > 0) { break; } if (enterType == 1) { strBuilder.Append("/r/n"); } } strResult = strBuilder.ToString(); return strResult; } return string.Empty; } catch (Exception ex) { //#region Loghandle by Tony 2008.11.21 return strResult; //#endregion } finally { if (sr != null) { sr.Close(); } } } #endregion

取出后就是再用正則取出<title>和</title>之間的部分。
這部分浪費了些時間，因為邀月的正則功底不行啊！·
先后試過如下正則表達式：

1 // stringstrRegEx="<[^>]*>";
2 // stringstrRegEx="<title>.*([^</title>])";
3 // stringstrRegEx="<title>(.*?)</title>";
4 // stringstrRegEx="<title>.*?</title>";

均不能達到想要的“經濟廉價”的效果，最終，找到這個：

演示效果如上圖：

后續問題：
１、將繼續實現代理方式躲過IP；
２、將嘗試另外一種通過Request.Filter方式直接替換來實現。
歡迎交流。
助人等于自助! 3w@live.cn

以一種"廉價"的方式獲取頁面的標題(downmoon)

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频