Spring Boot + Elasticsearch 实战：从 CRUD 到复杂查询全解析

在分布式系统架构中，高效的搜索能力已成为业务突破的关键支点。Elasticsearch 作为当下最流行的分布式搜索引擎，凭借实则时性、可扩展性和强劲的聚合分析能力，被广泛应用于日志分析、商品检索、数据监控等场景。本文将从实战角度出发，详解 Spring Boot 与 Elasticsearch 的两种整合方案，带您快速掌握从基础 CRUD 到复杂聚合查询的全流程实现。

一、核心概念：倒排索引与 Elasticsearch 优势

Elasticsearch 的高效检索能力源于其核心数据结构 —— 倒排索引。与传统数据库的正排索引（按文档→关键词映射）不同，倒排索引通过关键词→文档的映射关系，实现毫秒级的全文检索。例如在文档集合中，”Elasticsearch” 一词出现于文档 1、2、4，倒排索引会直接记录该词对应的文档 ID 及位置，大幅提升查询效率。

作为分布式搜索引擎，Elasticsearch 具备三大核心优势：

分布式架构：支持横向扩展至数百节点，轻松处理 PB 级数据
实时性：文档写入后秒级可检索，满足实时业务需求
丰富查询：支持全文检索、范围查询、聚合分析等复杂操作

二、整合方案一：ElasticsearchRepository 快速上手

Spring Data 提供的 ElasticsearchRepository 接口，通过继承即可实现基础 CRUD 操作，适合简单业务场景。

1. 定义实体与 Repository 接口

第一创建映射 Elasticsearch 文档的实体类（需添加 @Document 注解指定索引），再定义继承 ElasticsearchRepository 的接口：

java

@Document(indexName = "demo")
public class Demo {
    @Id
    private String id;
    private String imsi;
    private double costTime;
    // 省略getter/setter
}

public interface DemoRepository extends ElasticsearchRepository<Demo, String> {
    // 自定义方法（遵循Spring Data命名规范）
    List<Demo> findByImsi(String imsi);
    
    // 自定义DSL查询
    @Query("{"bool": {"must": [{"match": {"imsi": "?0"}}], "filter": {"range": {"costTime": {"gte": ?1, "lte": ?2}}}}}")
    List<Demo> findByImsiAndPriceRange(String imsi, double min, double max);
}

2. 服务层实现

通过注入 Repository 接口，直接调用内置方法或自定义方法完成数据操作：

java

@Service
public class DemoService {
    @Autowired
    private DemoRepository demoRepository;
    
    // 保存文档
    public Demo save(Demo demo) {
        return demoRepository.save(demo);
    }
    
    // 按条件查询
    public List<Demo> findByImsiAndPriceRange(String imsi, double min, double max) {
        return demoRepository.findByImsiAndPriceRange(imsi, min, max);
    }
}

三、整合方案二：ElasticsearchRestTemplate 进阶实战

对于复杂查询场景（如聚合分析、滚动查询），推荐使用 ElasticsearchRestTemplate，其提供更灵活的 DSL 构建能力。

1. 配置 RestTemplate

通过配置类初始化 RestHighLevelClient，支持权限认证与集群地址配置：

java

@Configuration
public class ElasticsearchConfig extends AbstractElasticsearchConfiguration {
    @Value("${spring.elasticsearch.uris:localhost:9200}")
    private String[] uris;
    
    @Override
    public RestHighLevelClient elasticsearchClient() {
        CredentialsProvider provider = new BasicCredentialsProvider();
        provider.setCredentials(AuthScope.ANY, new UsernamePasswordCredentials("user", "pwd"));
        
        RestClientBuilder builder = RestClient.builder(
            Arrays.stream(uris).map(HttpHost::create).toArray(HttpHost[]::new)
        ).setHttpClientConfigCallback(clientBuilder -> 
            clientBuilder.setDefaultCredentialsProvider(provider)
        );
        return new RestHighLevelClient(builder);
    }
}

2. 高级查询实现

（1）组合 Bool 查询

通过 NativeSearchQueryBuilder 构建多条件查询：

java

public List<Demo> complexSearch(String imsi, Double min, Double max) {
    BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
    if (imsi != null) {
        boolQuery.must(QueryBuilders.matchQuery("imsi", imsi));
    }
    if (min != null && max != null) {
        boolQuery.filter(QueryBuilders.rangeQuery("costTime").gte(min).lte(max));
    }
    
    NativeSearchQuery query = new NativeSearchQueryBuilder()
        .withQuery(boolQuery)
        .withPageable(PageRequest.of(0, 20))
        .build();
    
    return elasticsearchRestTemplate.search(query, Demo.class)
        .getSearchHits().stream()
        .map(SearchHit::getContent)
        .collect(Collectors.toList());
}

（2）聚合分析实战

以三级分组聚合（时间→域→IMSI）为例，实现总数与失败数统计：

java

public List<Map> statsAggregation(String startTime, String endTime) {
    // 构建基础查询条件
    BoolQueryBuilder boolQuery = QueryBuilders.boolQuery()
        .must(QueryBuilders.rangeQuery("rtime").gte(startTime).lte(endTime));
    
    // 构建聚合查询
    NativeSearchQuery query = new NativeSearchQueryBuilder()
        .withQuery(boolQuery)
        .addAggregation(AggregationBuilders.dateHistogram("by_minute")
            .field("rtime")
            .fixedInterval(DateHistogramInterval.MINUTE)
            .subAggregation(AggregationBuilders.terms("by_domain")
                .field("vpdndomain")
                .subAggregation(AggregationBuilders.terms("by_imsi")
                    .field("imsi")
                    .subAggregation(AggregationBuilders.count("total_count").field("_index"))
                    .subAggregation(AggregationBuilders.filter("fail_count",
                        QueryBuilders.boolQuery().mustNot(
                            QueryBuilders.termQuery("resulCode", "0000")
                        )))
                )))
        .build();
    
    // 解析聚合结果
    SearchHits<Authlog> hits = elasticsearchRestTemplate.search(query, Authlog.class);
    Histogram timeAgg = hits.getAggregations().get("by_minute");
    List<Map> result = new ArrayList<>();
    for (Histogram.Bucket timeBucket : timeAgg.getBuckets()) {
        Terms domainAgg = timeBucket.getAggregations().get("by_domain");
        for (Terms.Bucket domainBucket : domainAgg.getBuckets()) {
            Terms imsiAgg = domainBucket.getAggregations().get("by_imsi");
            for (Terms.Bucket imsiBucket : imsiAgg.getBuckets()) {
                long total = ((ValueCount) imsiBucket.getAggregations().get("total_count")).getValue();
                long fail = ((Filter) imsiBucket.getAggregations().get("fail_count")).getDocCount();
                result.add(Map.of(
                    "time", timeBucket.getKeyAsString(),
                    "domain", domainBucket.getKeyAsString(),
                    "imsi", imsiBucket.getKeyAsString(),
                    "total", total,
                    "fail", fail
                ));
            }
        }
    }
    return result;
}

四、测试与优化提议

索引管理：通过 ElasticsearchRestTemplate 实现索引自动创建与映射更新：

java

@Test
public void initIndex() {
    IndexOperations ops = elasticsearchRestTemplate.indexOps(Demo.class);
    if (!ops.exists()) {
        ops.create();
        ops.putMapping(Demo.class);
    }
}

性能优化：

大数据量查询使用滚动查询（Scroll API）避免内存溢出
聚合查询合理设置 size 参数，限制返回桶数量
批量操作通过 bulkIndex 提升写入效率

五、总结

Spring Boot 与 Elasticsearch 的整合可根据业务复杂度灵活选择方案：ElasticsearchRepository 适合快速开发基础功能，ElasticsearchRestTemplate 则胜任复杂查询与聚合分析。在实际项目中，需结合数据规模与查询场景，合理设计索引结构与查询逻辑，充分发挥 Elasticsearch 的分布式检索优势。通过本文的实战指南，信任开发者能快速掌握整合技巧，构建高效的搜索服务。

感谢关注【AI码力】，获取更多技术秘籍！