成功案例:

龙蛛搜索2.2.3080.38418发布-加入网页正文分析

局域网搜索引擎软件 龙蛛搜索2.2发布: 下载 软件说明 2008年1月前免费无限制使用 点击这里访问龙蛛搜索官方论坛

网上汇款免手续费, 收货满意后卖家才能拿钱,货款都安全

开发环境:Microsoft .NET Framework SDK
运行要求
  Windows 2000 或 Windows 2003 安装 .Net Framework 2.0
  web页面· web服务器上安装IIS,建议放在虚拟目录下,如果放在非虚拟目录下请把bin目录下文件, 放在父级虚拟目录下的bin目录内
  数据服务器建议安装 Microsoft SQL Server 2000中文版(或Microsoft SQL Server 2005),注意采用混合认证模式,并安装全文索引组件。
   

主要功能
1. 1分布式数据库采集与存储。
蜘蛛程序和数据库群组可分布在多台计算机中,提供专业级的数据采集与搜索服务。通过后台方便的开启分布式数据库群组和分布式蜘蛛工作站搜索,方便的数据库、表操作实现百万级数据存储。
1. 2强大的后台数据库管理功能。
可方便的建立和删除数据库群组中的数据库、数据表,可对数据表进行排序、激活、删除等功能。提供对蜘蛛的建立、删除、移动、启动、关闭等操作,可方便及时地查看入口网址更新情况和对入口网址的更新周期、pr值、搜索深度进行管理。
1. 3前台搜索提供显著提高搜索效率的强大的多表搜索方案。
简便快捷的网页个是修改,同时提供网络快照、相关搜索、网站简要信息等功能。提供用户企业级的搜索引擎服务。
1.4提供对站内页面搜索的支持,确保行业搜索的相关性。提供网页关键词、网址关键词等的筛选和屏蔽,可灵活的抓取网站的各类信息。为局域网、行业、垂直搜索提供最大限度的企业级支持。
1.5数据排序灵活多样。
可通过数据表排序、搜索时间排序以网站pr值排序等方式,提供给用户最需要的查询结果,为vip用户提供低层分类排序支持。

常见问题:

1. 搜索结果的排序是怎么控制的?排序实现是按照后台数据表的顺序,表中的数据是按照提取时间和叶面的pr值进行的。搜索结果的默认排序方式是按照数据表的优先度优先度高的表中的数据优先排列,在同一个表中先按照网页pr值进行排序,pr值相同的按照收录的时间顺序进行倒排,网页pr值是根据入口网址的初始pr值进行计算得出的,一般情况下,网页越深pr值越小。 
2. 为什么在搜索的时候,过长的关键词不能搜索?web搜索前台关键词字符总数不能超过10个,同时搜索的关键词不能超过两个。 
3. 可以不同的机器上可以使用相同的蜘蛛ID吗?可以在不同机器上同时开启多个相同id的蜘蛛程序进行搜索。 
4. 为什么有时候搜索结果显示大约0个结果?如果第一个数据表中的数据过少,在搜索时如果第一个没有找到结果那么搜索结果显示为0。 
5. 相关搜索关键词是怎么控制的?相关搜索关键词库是程序自动收集和记录的,当用户使用一个关键词进行搜索时,如果查找到的结果大于等于2个,那么这个关键词就会录入关键词库,并会在相关搜索中被显示。鼠标悬浮在搜索结果的相关关键词上时会提示这个关键词的搜索次数,并用热度来表示。 
6. 为什么我的数据库在增大到4G后,蜘蛛再也不能往里面追加数据,而且在SQL Server的企业管理器中也无法对数据库进行扩充?这是由于SQL Server服务器硬盘是FAT32格式的缘故,请将其转换为NTFS格式。在FAT32格式的硬盘中,单个文件最大尺寸为4G。具体方法是在命令行窗口中输入命令:CONVERT 盘符: /FS:NTFS。 
7. 为什么我在检索时,浏览器总是返回“error.htm”?对于某些版本的中文版SQL Server 2000,需要特别注意,在其缺省安装的情况下,全文索引配置目录中缺少一个名为noise.chs的噪声文件。解决办法:把压缩包中WEB发布文件夹下的noise.chs复制到SQL Server安装目录下的MSSQL\FTDATA\SQLServer\Config子目录,这一步一定要在对数据表进行全文索引之前进行操作,如果已经进行了全文索引操作,请在SQL企业管理器中讲你建立的数据表的全文索引删除,然后重新建立全文索引。如果不建立该文件,则无法进行中文全文检索。 
8. 我没有注册码,是否能够无限制的运行这个软件?在这个版本中,我们对软件的运行时间进行了限制,在2007年8月份之前,您可以放心的无限制的适用本软件,软件到期后,蜘蛛程序只能使用一个线程进行操作,每个网址只能搜索前500个数据。 
9. 使用SQL Server数据库的搜索效率如何?龙蛛搜索引擎系统做过的最高负荷测试是在1台数据服务器中10个数据表中存储了的50万条数据,搜索页面每日平均浏览量在10万次左右,高峰时期30分钟在线600人,对4个字节的关键词搜索时间小于1秒。(测试服务器配置为 IBM Piii 1G CPU ,256M内存,WEB服务器和数据库服务器在同一机器上)


  网站登陆 | 搜索管理 | 蛟龙博客 | 用户留言

[本站使用龙蛛自动化搜索引擎系统] © 2007 

龙蛛搜索客服:点击这里给我发消息   点击这里给我发消息

联系电话:13225430832