百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

零基础打造一款属于自己的网页搜索引擎

myzbx 2024-12-01 18:26 36 浏览

前言

在说这个之前,想必大家应该都比较了解搜索引擎了,它就是通过用户在浏览器输入框中输入文本,从而显示一些结果,你觉得哪项符合你要搜索的内容,你就点击哪项。

【一、项目准备】

浏览器:360浏览器

编辑器:Sublime Text 3

插件:Jquery-3.2.1.Min.Js

【二、项目实现】

由于是要实现一个网页搜索引擎,所以我们需要借用网页三剑客(Html+Css+Javascript),然后实现这一功能。

1.打开百度分析网页结构

我们可以先看看百度的搜索引擎:

可以看到,这个搜索框的部分设置,比如关闭自动完成功能。然后我们在随便搜索内容来查看它的变化:

image

可以看到某些我们查询的关键字,于是我们便发现了请求规律:

https://www.baidu.com/s?+查询字符参数

这就构成了我们的一个完整的get请求,而且这里面有很多关键字参数可以省略掉,只需要保留重要的一部分就好了。于是,经试验,得出如下结论:

https://www.baidu.com/s?wd=keyword

这个才是请求的接口地址,只需将keyword参数替换为任意搜索关键字即可实现查询并跳转到相应结果页面。

2.编写Html输入框,搜索按钮

看过之前写的Html系列的文章,你将不再对此感到困惑。

<html>
<head>
 <title></title>
 <style type="text/css">
    *{           内外边距初始时为0
       margin:0;    
       padding:0
    }
     input{
        width:300px;
        height:30px
    }
     span{
       position:absolute; 绝对定位
       background-color:red; 背景颜色
       border:1px solid gray; 边框设置
       width:60px;
       height:32px;
       text-align:center 文字位置
    }
    span:hover{ 鼠标悬停时的样式
        background-color:blue
    }
 </style>
</head>
<body>
<input type="text" name="" placeholder="请输入要搜索的内容"> 文本框
<span>search</span> 搜索按钮
</body>
</html>

编写完成后进入浏览器查看,即可看到:

可以看到,已经有点浏览器搜索框的意思了。

3.导入Jquery插件

<script src='jquery-3.2.1.min.js'></script>

4.编写js脚本

这个是重中之重,打开浏览器,network,继续分析:

可以看到搜索结果就在里面。然后打开这个请求的url地址,经过多次实验,发现就只有图中标记的参数有变化:

image.png

所以我们可以得出结论,我们只需要改变这两个值即可。

1).创建删除脚本

于是我先创建一个脚本标签,不用它的时候随时可以清除,避免占用内存,导致页面打开迟缓,性能降低:

var script=document.createElement('script');  创建script的标签
script.id='jsonp';   设置id为jsonp
script.src='https://www.baidu.com/sugrec?prod=pc&cb=getData&wd='+wd;  设置它的地址
document.body.appendChild(script);   添加script元素到body中

然后等它不用了,随时将它删除:

var script=document.createElement('script');  创建script的标签
script.id='jsonp';   设置id为jsonp
script.src='https://www.baidu.com/sugrec?prod=pc&cb=getData&wd='+wd;  设置它的地址
document.body.appendChild(script);   添加script元素到body中

2).生成选项下拉菜单

我们在浏览器可以看到,只要一输入文本,它就会弹出对应的选项让我们选择,那么这是如何办到的了?

<script>
function getlist(wd){    /*获取下拉列表*/
   var script=document.createElement('script');  /*创建script的标签*/
   script.id='jsonp';   /*设置id为jsonp*/
   script.src='https://www.baidu.com/sugrec?prod=pc&cb=getData&wd='+wd; /* 设置它的地址*/
   document.body.appendChild(script);   /*添加script元素到body中*/
}
function getData(data){  /*获取数据*/
     var script=document.querySelector('#jsonp'); /*选择id为jsonp的元素*/
     script.parentNode.removeChild(script);  /*从这个元素的父元素中删除这个元素*/
     $('ol').html('');  /* 设置有序列表的值为空*/
     var da=data.g;   /* 获取搜索的结果*/
  if(da){                     /*结果存在的话就将结果放到li标签中*/
   da.forEach(function(item,index){  
     $('<li><a target="_blank" href ="https://www.baidu.com/s?wd='+item.q+'">'+item.q+'</a></li>').appendTo('ol');
    })
    }
}


     /* 判断键盘是否按下*/
   $('input:text').keyup(function(){
      var wd=$(this).val();  /* 输入框的值*/
      if(wd==''){           /*如果值是空,那么就隐藏,否则显示*/
          $('ol').css('display','none');
          $('ol').css('zIndex',-10);  
      }else{
          $('ol').css('display','block');
       $('ol').css('zIndex',20);
      }
         getlist(wd);
  });
   </script>

可以看到,搜索结果已经出来了,而且有序列表下的"li"标签也都对应的生成了。

3).给选项标记序列

我们可以看到,结果终于出来,但是我想给它个序列号,这样就可以知道搜索结果有多少个了。要设置的标记方式有很多种,可以以数字开头,也可以是大小写字母或者罗马时间。在这里我选择数字,很简单。

终于非常完美的实现了这一功能,是不是很惊艳了,赶快去试下吧。

4).搜索刷新

看到这里相信大家应该都知道这个功能已经算是完成了,我们只需要随便点击哪个li标签都可以访问到相应的页面。于是,我决定添加一个刷新的功能,属于重连服务器的那种刷新:

<span onclick='window.location.reload()'>search</span> 点击后立即刷新

【三、项目总结】

总的来说,对于初学者小白是个很不错的练手项目,希望大家能从中有所收获。

需要源码的小伙伴,后台回复“搜索引擎”四个字即可获取。

****看完本文有收获?请转发分享给更多的人****

想学习更多Python网络爬虫与数据挖掘知识,可前往专业网站:http://pdcfighting.com/

相关推荐

网易《逆水寒》手游【逆水侠棋】首次正式更新,近 50 项调整优化

IT之家7月23日消息,网易《逆水寒》手游于6月27日迎来二周年资料片,推出了特色自走棋玩法【逆水侠棋】。游戏官方今日宣布,【逆水侠棋】玩法上线以来已经进行了4000多万场的对局,...

消息称英特尔Arrow Lake-S Refresh处理器下半年发布,升级NPU

IT之家7月7日消息,韩媒ZDNETKorea当地时间4日报道称,英特尔酷睿Ultra200S"ArrowLake-S"处理器的Refresh刷新版本将...

用户中心——比如:腾讯的QQ账号可以登录到很多应用当中 02

用户中心——比如:腾讯的QQ账号可以登录到很多应用当中02@[toc]前端登录注册blankTarget表示是一个用户点击时跳转时,是打开一个新的页面还是,在本地页面覆盖。constants公共...

英特尔发布6862图形驱动,相比Q1版本性能最高提升37%

IT之家7月11日消息,英特尔公司于7月8日,面向锐炫(Arc)B、A系列显卡、集成Arc核显的酷睿Ultra系列处理器,发布了32.0.101.6862(Q2.25)图...

Cryin:BLG打不过AL,与T1无缘了!JDG首发xiaoxu,WBG世界赛有望

【关注残影游戏,看LOL最新资讯,来看下这一期的撸圈日报吧!】TOP1Cryin:BLG打不过AL,与T1无缘了!在MSI的比赛中,AL与BLG双双输给了LCK,只不过AL终究是和GEN打满了五局,但...

安装SOLIDWORKS出现错误:“已安装较新版本”如何解决?

-SOLIDWORKS常见问题及技巧分享52-PART1:客户问题客户使用了SOLIDWORKS2024SP5版本作业,由于公司接到一个订单要求使用SOLIDWORKS2018...

《托尼·霍克职业滑板3+4》Xbox平台版本现已开启预载

《托尼·霍克职业滑板3+4》现已在Xbox平台开启预载,玩家可提前为7月11日的正式发售做准备。此外,官方还公布了XboxSeriesX|S版本的一些新细节。在《托尼·霍克职业滑板1+2》发售近...

SRAM套件会让整车更轻吗?车手战车:罗格利奇的S-Works Tarmac SL8

普里莫茨·罗格利奇(PrimozRoglic)以红牛-博拉-汉斯格雅车队主将的身份开启了2025年环法之旅。随着高山赛段的争夺,环法进入白热化阶段,罗格利奇的总成绩也在不断上升中。弗洛里...

MST 全新一代 RMX 4 S PRO 正式登场

MST(MaxSpeedTechnology,得隆科技)正式宣布,下一代RMX漂移底盘即将登场,命名为RMX4。全新RMX4延续当前主流的后驱(RWD)漂移布局,在经典架构的基础上大...

S960Q钢板综合解析S960Q钢板化学成分

S960Q钢板综合解析(欧标EN10025-6)一、化学成分S960Q采用低碳+微合金化设计,化学成分严格控制杂质元素,核心配比如下:元素含量范围关键作用碳(C)≤0.20%保障焊接性及韧性锰...

英伟达优化DLSS 4:Transformer模型显存占用减少20%

IT之家6月29日消息,除了推出DLSS4正式版,英伟达还在其最新的DLSSSDK版本中对显存(VRAM)使用进行了优化。VideoCardz发现,DLSS310.3.0将...

消息称三星工艺高通SM8850s“套片报价更低,可能明年才会上”

IT之家7月2日消息,消息源@数码闲聊站今日表示,其最近又“摸到”了采用三星晶圆代工SF2工艺、代号为SM8850s的高通SM8850旗舰移动芯片变体。这位博主表示:“听说(...

防止开源供应链“下毒”,谷歌推出OSS Rebuild项目

IT之家7月22日消息,为提升开源项目的安全性,谷歌今日推出了OSSRebuild,开发者可利用该工具通过重现构建过程来验证开源软件包的完整性,从而避免开源供应链“下毒”情况。谷歌介绍称,...

向经典致敬!2025本田GB350/S披上70年代蓝白新色登场

Honda发表了新复古车款GB350及其衍生版本GB350S的2025年款。这是自2023年以来,时隔两年的改款,除了变更了头尾灯及仪表的规格外,还首次采用了双色调配色。车辆规格与配备方面则没有变更。...

铠侠推出目前最大容量固态硬盘:企业级LC9新增245.76TB版本

IT之家7月22日消息,铠侠日本当地时间今日宣布为主打大容量存储的LC9系列企业级固态硬盘新增245.76TB版本。这一新型号在成为目前最大容量SSD的同时也是首款来到256TB...