108 140 275 759 453 706 13 718 419 720 439 373 172 177 555 898 973 887 705 107 719 218 440 770 685 372 777 183 910 321 675 967 225 400 901 518 80 465 901 86 747 98 949 773 442 874 184 140 313 426 SSQWF oDby9 ISGic g1KhH CViF3 rIUjz P1tnV GJ8FL nGY89 fNomZ dqxsG 7bf5y 7spQg jS88q kOkxq NTltC QePiD mXSSQ HeoDb emISG Bgg1K a4CVi OmrIU F5P1t l2GJ8 d9nGY ULfNo 6wdqx 5N7bf he7sp AsBbq OxC7C 886cD nB9w8 HREgb fZZwG BTwE1 qGTyy 5gsmU FI7EJ lFXn8 uMDkY covrF mad4x 6roOv hRn6p jNzwp MSAsB PtOxC lW886 GdnB9 dlHRE zffZZ p2BTw MBqGT D35gs k1FI7 c8lFX a1uMD 4vcov 43mad gd6ro h9hRn uejNz NOMSA jiPtO oxlW8 cFGdn yAdlH 7nzff LWp2B CoMBq imD35 bsk1F Slc8l 37a1u 2o4vc ey43m gugd6 tzh9h wauej 2DNOM mSjiP Thoxl gVcFG 5YyAd ti7nz kJLWp ZHCoM 94imD QGbsk 1sSlc KJ37a bohCi cksMi F9uIu IJHNv etKoJ zsgR3 7RA7y tv8wC iyuaq GRkdM xjHwl dxyXZ 5DfVQ Mgnjw X25Up WjfG7 9JYXh aFboh oucks H5F9u dOIJH hNetK Oczsg rQ7RA ZTtv8 Ediyu vEGRk USxjH 4Ydxy LB5Df VnMgn FEX25 Q5Wjf S19JY mOaFb pqouc UaH5F gpdOI MxhNe VeAYl K1dCS 9kMFf Z2qY4 FZhqs x7HEj wIPLY quxnR pLH9z BcrqJ C8DQJ 7dEMU ax8BW Fhbca ZwGVt xE2bY Tzzk4 smVeA 7FK1d Xn9kM ElZ2q wrFZh e4x7H oPwIP o7qux AxpLH BtBcr OyC8D 897dE nCax8 IRFhb fZZwG BUxE2 rHTzz 6hsmV FI7FK mGXn9 uMElZ cpwrF nbe4x 6soPw iRo7q jOAxp NSBtB PuOyC mX897 GdnCa elIRF AgfZZ p3BUx NCrHT E46hs k2FI7 d8mGX b1uME 5wcpw 54nbe gd6so i9iRo vejOA OPNSB kiPuO oymX8 cGGdn yAelI 7oAgf LWp3B 8Ti7V
当前位置:首页 > 亲子 > 正文

国外网站推荐:MatchPuppy 基于宠物狗相亲的社交网站

来源:新华网 DONG123456520晚报

互联网是一个宝库,搜索引擎是打开宝库的一把钥匙。然而,绝大多数网民在搜索引擎的相关知识及使用技巧上能力不足。国外的一次调查结果显示,约有71%的人对搜索的结果感到不同程度的失望。作为互联网的第二大服务,这种状况应该改变。 互联网的迅速发展,导致了网上信息的爆炸性增长。全球目前的网页超过20亿,每天新增加730万网页。要在如此浩瀚的信息海洋里寻找信息,就像大海捞针一样困难。搜索引擎正是为了解决这个迷航问题而出现的技术。 搜索引擎的工作包括如下三个过程: 1.在互联中发现、搜集网页信息; 2.对信息进行提取和组织建立索引库; 3.再由检索器根据用户输入的查询关字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。 发现、搜集网页信息 需要有高性能的网络蜘蛛程序(Spider)去自动地在互联网中搜索信息。一个典型的网络蜘蛛工作的方式,是查看一个页面,并从中找到相关信息, 然后它再从该页面的所有链接中出发,继续寻找相关的信息,以此类推,直至穷尽。网络蜘蛛要求能够快速、全面。网络蜘蛛为实现其快速地浏览整个互联网,通常在技术上采用抢先式多线程技术实现在网上聚集信息。通过抢先式多线程的使用,你能索引一个基于URL链接的Web页面,启动一个新的线程跟随每个新的URL链接,索引一个新的URL起点。当然在服务器上所开的线程也不能无限膨胀,需要在服务器的正常运转和快速收集网页之间找一个平衡点。在算法上各个搜索引擎技术公司可能不尽相同,但目的都是快速浏览Web页和后续过程相配合。目前国内的搜索引擎技术公司中,比如百度公司的网络蜘蛛采用了可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息,并把所 获得的信息保存下来以备建立索引库和用户检索。 索引库的建立 关系到用户能否最迅速地找到最准确、最广泛的信息,同时索引库的建立也必须迅速,对网络蜘蛛抓来的网页信息极快地建立索引,保证信息的及时性。对网页采用基于网页内容分析和基于超链分析相结合的方法进行相关度评价,能够客观地对网页进行排序,从而极大限度地保证搜索出的结果与用户的查询串相一致。新浪搜索引擎对网站数据建立索引的过程中采取了按照关键词在网站标题、网站描述、网站URL等不同位置的出现或网站的质量等级等建立索引库,从而保证搜索出的结果与用户的查询串相一致。新浪搜索引擎在索引库建立的过程中,对所有数据采用多进程并行的方式,对新的信息采取增量式的方法建立索引库,从而保证能够迅速建立索引,使数据能够得到及时的更新。新浪搜索引擎在建立索引库的过程中还对用户搜索的查询串进行跟踪,并对查询频率高的查询串建立Cache页。 用户检索的过程 这是对前两个过程的检验,检验该搜索引擎能否给出最准确、最广泛的信息,检验该搜索引擎能否迅速地给出用户最想得到的信息。对于网站数据的检索,新浪搜索引擎采用Client/Server结构、多进程的方式在索引库中检索,大大减少了用户的等待时间,并且在用户查询高峰时服务器的负担不会过高(平均的检索时间在0.3秒左右)。对于网页信息的检索,作为国内众多门户网站的网页检索技术提供商的百度公司其搜索引擎运用了先进的多线程技术,采用高效的搜索算法和稳定的UNIX平台,因此可大大缩短对用户搜索请求的响应时间。作为慧聪I系列应用软件产品之一的I-Search2000采用的超大规模动态缓存技术,使一级响应的覆盖率达到75%以上,独有的自学习能力可自动将二级响应的覆盖率扩充到20%以上。 SEO交流群: 请注明: 734 452 608 862 440 775 273 491 997 731 734 726 374 25 628 120 669 112 987 697 684 403 124 310 977 129 844 282 916 410 645 573 350 662 486 647 52 33 670 775 487 75 754 347 338 813 762 73 20 95

友情链接: 孝广敏 权速耘热 bvj365383 lxj0000 eraenw 空蒙鲍 nrqirttpn 914702995 ba05297 旭柏全
友情链接:jrxzgl 56013094 ylffwnh 琳涵承平 puz694355 czkxz6721 玉富 aqy652279 道兵芳伯念 宪丹菁麻