[搜索技巧][图文]用构造一个C#语言的爬虫程序
C#特别适合于构造蜘蛛程序,这是因为它已经内置了HTTP访问和多线程的能力,而这两种能力对于蜘蛛程序来说都是非常关键的。下面是构造一个蜘蛛程序要解决的关键问题:  ⑴HTML分析:需要某种HTML解析...
[搜索技巧]搜索引擎中网络爬虫的设计分析
下面简单介绍一下搜索引擎的机器爬虫的制作和一些基本要注意的事项。说的简单易懂一些,网络爬虫跟你使用的〖离线阅读〗工具差不多。说离线,其实还是要跟网络联结,否则怎么抓东西下来?那么不同的地方在哪里?1】...
[搜索技巧][图文]搜索引擎算法研究
1.引言万维网WWW(WorldWideWeb)是一个巨大的,分布全球的信息服务中心,正在以飞快的速度扩展。1998年WWW上拥有约3.5亿个文档[14],每天增加约1百万的文档[6],不到9个月的时...
[搜索技巧]搜索引擎分类与工作原理
搜索引擎分类  搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎( FullTextSearchEngine)、目录索引类搜索引擎(SearchIndexDirectory)和元搜索引擎(Met...
[搜索技巧]搜索引擎排名的作用及搜索引擎排名的商业价值
Google搜索引擎排名牵动商机 PatrickAhern很清楚Google的力量,少了它,生意还真不好作。 他所任职总裁的数据复原集团(DataRecoveryGroup)向来在Google搜寻引擎...
[搜索技巧]什么是Heritrix-开源crawler
是IA的开放源代码,可扩展的,基于整个Web的,归档网络爬虫工程Heritrix工程始于2003年初,IA的目的是开发一个特殊的爬虫,对网上的资源进行归档,建立网络数字图书馆,在过去的6年里,IA已经...
[搜索技巧]nutch 高亮和增加索引长度
高亮显示比较简单,网上也有很多介绍代码。修改如下:将org.apache.nutch.searcher.Summary第54行代码修改为:publicStringtoString(){return"<...
[搜索技巧]搜索引擎技术核心揭密(使用PHP编制搜索引擎)
这是一篇精彩的编程教学文章,不但详细地剖析了搜索引擎的原理,也提供了笔者自己对使用PHP编制搜索引擎的一些思路。整篇文章深入浅出,相信无论是高手还是菜鸟,都能从中得到不少的启发。  谈到网页搜索引擎时...
[搜索技巧]搜索三大定律:相关性、人气质量和自信心
搜索引擎走到今天,已经是一个结束过去,开辟未来的时候了。为了说清楚我所讲的第三定律,我们先来回顾一下第一和第二定律。■第一定律相关性定律 听起来象是一篇学术论文,的确,就连第一,第二定律的提法以前也没...
[搜索技巧]Google排名秘密:下划线将等于词分隔符
MattCutts最近出席了专为WordPre用户及开发者举行的WordCamp2007大会,在会上,身为WordPre用户的Matt披露了不少与Google排名相关的秘密。并且Matt还首次确认了一...
[搜索技巧][图文]搜索、引擎、优化、营销(点位思考)
1.人们会寻找东西,这是搜索2.人们的能力有限,制造了自动化工作的引擎3.人们发现自动化的引擎工作不怎么靠谱,所有优化自己的关键词4.一些人发现了可以欺骗引擎的方法,所以引擎要反作弊5.引擎发现了很多...
[搜索技巧]谈搜索引擎暗规则序
马太效应:搜索引擎暗规则之一2080法则:搜索引擎暗规则之二破窗理论:搜索引擎暗规则之三羊群效应:搜索引擎暗规则之四搜索引擎暗规则序中国人有句古话叫做:“学以至用”。若干年我一...
[搜索技巧]WEB网页结构化信息抽取技术介绍
WEB结构化信息抽取就是将网页中的非结构化数据按照一定的需求抽取成结构化数据。是垂直搜索引擎和通用搜索引擎最大的差别。  如:比较购物搜索那就需要抓取网页后,对网页中的商品信息进行抽取,抽取出商品名称...
[搜索技巧]浅谈垂直搜索引擎
通过关键字:"垂直搜索引擎"在google查一下,在返回结果中可以看到不少的投资公司很看好这一领域,即使百度的发言人也在演讲中提到垂直搜索引擎,而一些国外软件巨头例如Google和Microsoft也...
[搜索技巧]如何做好一个垂直搜索引擎
引用几句话:1.“确解用户之意,切返用户之需。”2.“门户网站都想着是怎样省钱,而不是怎样花钱来买技术。”3.“搜索引擎不是人人都能做的领域...
[搜索技巧]垂直搜索引擎的选型
网页搜索引擎的存在有他存在的土壤,土壤环境是怎么样的呢?1.海量的数据,互联网上有海量的数据,并且这些数据在快速增长、不断更新2.分散的数据,这些数据存在于成千上万个网站中3.多样化的数据4.用户多样...
[搜索技巧]使用站内检索的五大理由
Abstract:本文主要介绍了站内检索对internet网站的五大作用:所寻即所得;了解访问者的意图;符合网民的习惯;提升网站信息的价值;身份的象征。最后介绍了目前的网际搜索引擎不能替代站内检索的原...
[搜索技巧]揭密中文搜索引擎四大技术:中文分词
信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索...
[搜索技巧][图文]揭密中文搜索引擎四大技术:系统架构
互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今...
[搜索技巧][图文]揭密中文搜索引擎四大技术:网络蜘蛛
随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎...
 搜索技巧   22   20   1/2页   9   7   1   2   8   :   GO