|
常见问题:
1. 搜索结果的排序是怎么控制的?排序实现是按照后台数据表的顺序,表中的数据是按照提取时间和叶面的pr值进行的。搜索结果的默认排序方式是按照数据表的优先度优先度高的表中的数据优先排列,在同一个表中先按照网页pr值进行排序,pr值相同的按照收录的时间顺序进行倒排,网页pr值是根据入口网址的初始pr值进行计算得出的,一般情况下,网页越深pr值越小。
2. 为什么在搜索的时候,过长的关键词不能搜索?web搜索前台关键词字符总数不能超过10个,同时搜索的关键词不能超过两个。
3. 可以不同的机器上可以使用相同的蜘蛛ID吗?可以在不同机器上同时开启多个相同id的蜘蛛程序进行搜索。
4. 为什么有时候搜索结果显示大约0个结果?如果第一个数据表中的数据过少,在搜索时如果第一个没有找到结果那么搜索结果显示为0。
5. 相关搜索关键词是怎么控制的?相关搜索关键词库是程序自动收集和记录的,当用户使用一个关键词进行搜索时,如果查找到的结果大于等于2个,那么这个关键词就会录入关键词库,并会在相关搜索中被显示。鼠标悬浮在搜索结果的相关关键词上时会提示这个关键词的搜索次数,并用热度来表示。
6. 为什么我的数据库在增大到4G后,蜘蛛再也不能往里面追加数据,而且在SQL Server的企业管理器中也无法对数据库进行扩充?这是由于SQL Server服务器硬盘是FAT32格式的缘故,请将其转换为NTFS格式。在FAT32格式的硬盘中,单个文件最大尺寸为4G。具体方法是在命令行窗口中输入命令:CONVERT 盘符: /FS:NTFS。
7. 为什么我在检索时,浏览器总是返回“error.htm”?对于某些版本的中文版SQL Server 2000,需要特别注意,在其缺省安装的情况下,全文索引配置目录中缺少一个名为noise.chs的噪声文件。解决办法:把压缩包中WEB发布文件夹下的noise.chs复制到SQL Server安装目录下的MSSQL\FTDATA\SQLServer\Config子目录,这一步一定要在对数据表进行全文索引之前进行操作,如果已经进行了全文索引操作,请在SQL企业管理器中讲你建立的数据表的全文索引删除,然后重新建立全文索引。如果不建立该文件,则无法进行中文全文检索。
8. 我没有注册码,是否能够无限制的运行这个软件?在这个版本中,我们对软件的运行时间进行了限制,在2007年8月份之前,您可以放心的无限制的适用本软件,软件到期后,蜘蛛程序只能使用一个线程进行操作,每个网址只能搜索前500个数据。
9. 使用SQL Server数据库的搜索效率如何?龙蛛搜索引擎系统做过的最高负荷测试是在1台数据服务器中10个数据表中存储了的50万条数据,搜索页面每日平均浏览量在10万次左右,高峰时期30分钟在线600人,对4个字节的关键词搜索时间小于1秒。(测试服务器配置为 IBM Piii 1G CPU ,256M内存,WEB服务器和数据库服务器在同一机器上) |