前提:下载Elasticsearch服务并开启,使用SpringBoot集成Elasticsearch客户端
用到的技术:Springboot+Vue+Thymeleaf+Elasticsearch
效果如下
接下来上代码(不分前后顺序)
页面跳转controller
package com.wyh.controller;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.GetMapping;
@Controller
public class IndexController {
@GetMapping({"/","/index"})
public String index() {
return "index";
}
}
接口数据请求controller
package com.wyh.controller;
import com.wyh.service.JDContentService;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RestController;
import javax.annotation.Resource;
import java.io.IOException;
import java.util.List;
import java.util.Map;
//前端请求编写
@RestController
public class JDContentController {
@Autowired
private JDContentService jdContentService;
//测试es批量添加京东数据 restful风格
@GetMapping("/parse/{keyword}")
public boolean parse(@PathVariable("keyword") String keyword) throws IOException {
return jdContentService.parseContent(keyword);
}
//测试查询
@GetMapping("/search/{keyword}/{pageNo}/{pageSize}")
public List
京东商品实体
package com.wyh.entity;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
import org.springframework.stereotype.Component;
@Data
@AllArgsConstructor
@NoArgsConstructor
@Component
public class JDContent {
private String title;
private String img;
private String price;
//可以自定义继续加属性
}
京东商品service
package com.wyh.service;
import com.alibaba.fastjson.JSON;
import com.wyh.entity.JDContent;
import com.wyh.utils.HtmlParseUtil;
import org.elasticsearch.action.bulk.BulkRequest;
import org.elasticsearch.action.bulk.BulkResponse;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.common.text.Text;
import org.elasticsearch.common.unit.TimeValue;
import org.elasticsearch.common.xcontent.XContentType;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.index.query.TermQueryBuilder;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightBuilder;
import org.elasticsearch.search.fetch.subphase.highlight.HighlightField;
import org.springframework.stereotype.Service;
import javax.annotation.Resource;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.Map;
import java.util.concurrent.TimeUnit;
//业务编写
@Service
public class JDContentService {
//注入bean
@Resource
private RestHighLevelClient client;
//1 解析数据 放入es索引库
public boolean parseContent(String keywords) throws IOException {
ArrayList jdContents = new HtmlParseUtil().parseJD(keywords);
//把查询并且解析好的数据批量插入到es库
BulkRequest bulkRequest = new BulkRequest();
//过期时间2分钟
bulkRequest.timeout("2m");
//批量插入数据
for (int i = 0; i < jdContents.size(); i++) {
bulkRequest.add(new IndexRequest("jd_goods")
//这里就不给id赋值了 随时生成
.source(JSON.toJSONString(jdContents.get(i)),XContentType.JSON)
);
}
//执行批量插入请求
BulkResponse bulk = client.bulk(bulkRequest, RequestOptions.DEFAULT);
//没有返回失败就是成功
return !bulk.isFragment();
}
//2 获取这些数据 实现搜索功能
public List
解析页面工具包
package com.wyh.utils;
import com.wyh.entity.JDContent;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.springframework.stereotype.Component;
import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
@Component
public class HtmlParseUtil {
//public static void main(String[] args) throws IOException {
// //ArrayList jdContents = parseJD("你好");
// //for (JDContent jdContent : jdContents) {
// // System.out.println(jdContent);
// //}
// 获取请求 前提需要联网
// //String url="https://search.jd.com/Search?keyword=java";
// 解析网页 jsoup返回的document对象就是浏览器document对象
// 所有在js中可以使用的方法,这里都能使用 比如document.getElementById()
// //Document document = Jsoup.parse(new URL(url), 30000);
// 获取我们想要的数据
// //Element element = document.getElementById("J_goodsList");
// //System.out.println(element.html());
// 获取全部的li元素
// //Elements elements = element.getElementsByTag("li");
// //System.out.println(elements);
// 获取元素中的内容
// //for (Element el : elements) {
// // //图片
// // //为什么明明可以看到图片的src但是就是获取不到呢
// // //这里面用到一个懒加载机制 真正的图片是放在source-data-lazy-img(data-lazy-img)中的
// // String img = el.getElementsByTag("img").eq(0).attr("data-lazy-img");
// // //价格
// // String price = el.getElementsByClass("p-price").eq(0).text();
// // //标题
// // String title = el.getElementsByClass("p-name").eq(0).text();
// // System.out.println("-------------------------------");
// // System.out.println(img);
// // System.out.println(price);
// // System.out.println(title);
// //
// //}
//}
//解析京东请求
public ArrayList parseJD(String keywords) throws IOException {
//获取请求 前提需要联网
String url="https://search.jd.com/Search?keyword="+keywords;
//解析网页 jsoup返回的document对象就是浏览器document对象
//所有在js中可以使用的方法,这里都能使用 比如document.getElementById()
Document document = Jsoup.parse(new URL(url), 30000);
//获取我们想要的数据
Element element = document.getElementById("J_goodsList");
System.out.println(element.html());
//获取全部的li元素
Elements elements = element.getElementsByTag("li");
//京东实体对象集合
ArrayList jdContents = new ArrayList<>();
//获取元素中的内容
for (Element el : elements) {
//图片
//为什么明明可以看到图片的src但是就是获取不到呢
//这里面用到一个懒加载机制 真正的图片是放在source-data-lazy-img(data-lazy-img)中的
String img = el.getElementsByTag("img").eq(0).attr("data-lazy-img");
//价格
String price = el.getElementsByClass("p-price").eq(0).text();
//标题
String title = el.getElementsByClass("p-name").eq(0).text();
System.out.println("-------------------------------");
System.out.println(img);
System.out.println(price);
System.out.println(title);
//创建京东实体对象
JDContent jdContent = new JDContent();
jdContent.setImg(img);
jdContent.setTitle(title);
jdContent.setPrice(price);
//把全部属性放进集合里面
jdContents.add(jdContent);
}
return jdContents;
}
}
es配置
package com.wyh.config;
import org.apache.http.HttpHost;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
//表面这是一个配置文件
@Configuration
public class ElasticSearchClientConfig {
//配置bean 注册 rest高级客户端
@Bean
public RestHighLevelClient restHighLevelClient(){
RestHighLevelClient client = new RestHighLevelClient(
RestClient.builder(
//ip 端口 协议
//一定要保证es服务是开启的
new HttpHost("127.0.0.1",9200,"http")));
return client;
}
}
新建一个索引库 用来存放京东数据
springboot application配置
#端口 server.port=8080 #关闭thymeleaf缓存 spring.thymeleaf.cache=false
页面
仿京东高亮搜索
pom
4.0.0 org.springframework.boot spring-boot-starter-parent 2.6.6 com wyh 0.0.1-SNAPSHOT wyh Demo project for Spring Boot 1.8 7.6.1 org.jsoup jsoup 1.10.2 org.springframework.boot spring-boot-starter-thymeleaf org.springframework.boot spring-boot-starter-test test org.springframework.boot spring-boot-starter-web org.springframework.boot spring-boot-starter-data-elasticsearch org.springframework.boot spring-boot-starter-web org.projectlombok lombok 1.16.10 com.alibaba fastjson 1.2.70 org.springframework.boot spring-boot-maven-plugin
测试接口
测试批量插入数据 java
成功插入到数据库
再插入点vue数据
测试查询接口
引入vue.js和axios.js
项目目录



