<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>網站流量 &#8211; HIHOST</title>
	<atom:link href="https://www.hihost.com.tw/tag/%E7%B6%B2%E7%AB%99%E6%B5%81%E9%87%8F/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.hihost.com.tw</link>
	<description>網站系統開發．物聯網</description>
	<lastBuildDate>Wed, 11 Jun 2025 08:09:28 +0000</lastBuildDate>
	<language>zh-TW</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.2</generator>
	<item>
		<title>網站流量大增的原因-搜尋引擎(bots)/搜尋蜘蛛(spiders)</title>
		<link>https://www.hihost.com.tw/2024/06/28/%e7%b6%b2%e7%ab%99%e6%b5%81%e9%87%8f%e5%a4%a7%e5%a2%9e%e7%9a%84%e5%8e%9f%e5%9b%a0-%e6%90%9c%e5%b0%8b%e5%bc%95%e6%93%8ebots-%e6%90%9c%e5%b0%8b%e8%9c%98%e8%9b%9bspiders/</link>
		
		<dc:creator><![CDATA[edwintsai]]></dc:creator>
		<pubDate>Fri, 28 Jun 2024 08:26:43 +0000</pubDate>
				<category><![CDATA[網站相關]]></category>
		<category><![CDATA[bots]]></category>
		<category><![CDATA[spiders]]></category>
		<category><![CDATA[搜尋引擎]]></category>
		<category><![CDATA[網站流量]]></category>
		<guid isPermaLink="false">https://www.hihost.com.tw/?p=53</guid>

					<description><![CDATA[某天可能會發現，原本一個小站突然網站流量大增，但看來自己的客流量或反應也沒有增加多少，但可能要因此付出超過流量 [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p>某天可能會發現，原本一個小站突然網站流量大增，但看來自己的客流量或反應也沒有增加多少，但可能要因此付出超過流量的費用，這真的是很痛啊～</p>



<p>接著去查看了網站的存取記錄，發現有很多是由各種搜尋引擎爬蟲，有時也稱為搜尋機器人(bots)或是搜尋蜘蛛(spiders)，會爬取你的網站，搜尋有變動的內容並且重新更新搜尋引擎的搜尋檢索。</p>



<p class="has-secondary-color has-tertiary-background-color has-text-color has-background has-link-color wp-elements-5790df29e50f6b6a0251febdc549a85e"><strong>問題是&#8230;有些我不認識.. 有些我不想要&#8230;還有些不道德？</strong></p>



<p>雖然有一些好的機器人可以提供有用的服務（例如Googlebot 和Bingbot，它們可以幫助您的網站被兩大搜尋引擎編入索引，以便潛在客戶可以找到您），但壞的機器人可能會透過以下方式對您的網站和業務造成各種損害：</p>



<ul class="wp-block-list">
<li>嘗試<a href="https://datadome.co/learning-center/ddos-layer-7-security-protection/">分散式阻斷服務 (DDoS) 第 7 層攻擊</a>。</li>



<li>抓取您網站上可能被非法使用的私人信息，例如出售用戶資料。</li>



<li>在其他網站上重新發布您的內容，導致內容重複和其他問題。</li>
</ul>



<p>即使是好的機器人，如果管理不當，也可能會對您的伺服器資源造成額外的負擔，從而導致流量負載增加並降低網站的速度。 如果您有網站和伺服器，管理和阻止機器人（尤其是不良機器人）非常重要。然而，有兩個主要挑戰：</p>



<p>我們不能簡單地阻止所有機器人，因為有些好的機器人可能是有益的。<br>我們絕不希望無意中錯誤地阻止合法用戶。</p>



<p class="has-secondary-color has-tertiary-background-color has-text-color has-background has-link-color wp-elements-387916e141289d07edb469c873b06303"><strong>如何用robts.txt 這個檔案去控制搜尋蜘蛛</strong></p>



<p>robots.txt 文件是必須放在網站根目錄裡，如果你的網址是example.com 是可以讀取到的。</p>



<p>網址位置：http://example.com/robots.txt</p>



<p>如果沒有這個檔案的話，你可以使用純文件檔案建立一個新的robots.txt文件，並上傳網站根目錄。</p>



<p class="has-secondary-color has-tertiary-background-color has-text-color has-background has-link-color wp-elements-a3168553ecb1ed34e4e9b6399d59901f"><strong>最常被阻擋的搜尋引擎使用者代理</strong></p>



<p>AhrefsBot<br>Baiduspider<br>Ezooms<br>MJ12bot<br>YandexBot</p>



<p>阻擋語法範例如下：<br>User-agent: AhrefsBot<br>Disallow: /<br>User-agent: Baiduspider<br>Disallow: /</p>



<p class="has-secondary-color has-tertiary-background-color has-text-color has-background has-link-color wp-elements-11f8739f2c4d9d7a8ba95db194da00a8"><strong>最近新發現的搜尋引擎使用者代理</strong></p>



<p>Huawei International Pte. Ltd.<br>Usage Type: Search Engine Spider<br>Hostname(s): petalbot-114-119-146-244.petalsearch.com<br>Domain Name: huawei.com<br>Country: Singapore</p>



<p>GPTBot： GPTBot/1.2; +https://openai.com/gptbot<br>OpenAI公司</p>



<p></p>



<p></p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
