Python Elasticsearch操作指南:从创建索引到数据写入
191 浏览量
更新于2024-08-31
收藏 107KB PDF 举报
"这篇文档详细阐述了如何使用Python与Elasticsearch进行交互,从创建索引到写入数据的步骤。主要关注点在于利用Python的Elasticsearch库来操作ES实例,包括设置映射(mappings)以及向索引中添加数据。"
在Python中,与Elasticsearch进行交互首先需要导入Elasticsearch模块。以下代码展示了如何连接到一个运行在`192.168.1.1:9200`的Elasticsearch实例:
```python
from elasticsearch import Elasticsearch
es = Elasticsearch('192.168.1.1:9200')
```
创建索引是通过`indices.create()`方法实现的。在本例中,我们创建了一个名为`index_test`的索引,并定义了其映射结构。映射定义了每个字段的数据类型和索引行为。下面是一个示例映射定义:
```python
mappings = {
"mappings": {
"type_doc_test": { # type_doc_test为doc_type
"properties": {
"id": {"type": "long", "index": "false"},
"serial": {"type": "keyword", "index": "false"},
"tags": {
"type": "object",
"properties": {
"content": {"type": "keyword", "index": True},
"dominant_color_name": {"type": "keyword", "index": True},
"skill": {"type": "keyword", "index": True},
},
},
"hasTag": {"type": "long", "index": True},
"status": {"type": "long", "index": True},
"createTime": {
"type": "date",
"format": "yyyy-MM-ddHH:mm:ss||yyyy-MM-dd||epoch_millis",
},
"updateTime": {
"type": "date",
"format": "yyyy-MM-ddHH:mm:ss||yyyy-MM-dd||epoch_millis",
},
},
}
}
}
```
映射中的字段类型有:
- `id`:定义为`long`类型,且`index`设为`false`,表示该字段不会被索引。
- `serial`:同样为`keyword`类型,不被索引。
- `tags`:是对象类型,其子字段`content`、`dominant_color_name`和`skill`都是可被索引的`keyword`类型。
- `hasTag`、`status`:为`long`类型,会被索引。
- `createTime`、`updateTime`:为日期类型,使用多种格式,包括`yyyy-MM-ddHH:mm:ss`、`yyyy-MM-dd`和毫秒级时间戳。
创建索引的代码如下:
```python
res = es.indices.create(index='index_test', body=mappings)
```
写入数据至已创建的索引中,需要根据所定义的映射结构构造相应的JSON文档,然后使用`index()`方法:
```python
doc = {
"id": 1,
"serial": "serial1",
"tags": {
"content": "tag content",
"dominant_color_name": "red",
"skill": "programming",
},
"hasTag": 1,
"status": 0,
"createTime": "2022-01-01 00:00:00",
"updateTime": 1640966400000, # epoch_millis
}
res = es.index(index='index_test', id=1, body=doc)
```
这段代码将插入一个具有指定ID和属性的新文档到`index_test`索引中。如果成功,`index()`方法会返回包含操作结果的响应。
总结来说,使用Python与Elasticsearch进行交互,涉及的关键点包括连接ES实例、定义索引映射以及向索引中添加数据。通过这种方式,我们可以构建一个完整的数据存储和检索系统,适用于日志分析、全文搜索等多种场景。
2020-09-18 上传
2020-12-31 上传
2020-12-23 上传
点击了解资源详情
2020-09-18 上传
103 浏览量
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38576392
- 粉丝: 7
- 资源: 896
最新资源
- 全国江河水系图层shp文件包下载
- 点云二值化测试数据集的详细解读
- JDiskCat:跨平台开源磁盘目录工具
- 加密FS模块:实现动态文件加密的Node.js包
- 宠物小精灵记忆配对游戏:强化你的命名记忆
- React入门教程:创建React应用与脚本使用指南
- Linux和Unix文件标记解决方案:贝岭的matlab代码
- Unity射击游戏UI套件:支持C#与多种屏幕布局
- MapboxGL Draw自定义模式:高效切割多边形方法
- C语言课程设计:计算机程序编辑语言的应用与优势
- 吴恩达课程手写实现Python优化器和网络模型
- PFT_2019项目:ft_printf测试器的新版测试规范
- MySQL数据库备份Shell脚本使用指南
- Ohbug扩展实现屏幕录像功能
- Ember CLI 插件:ember-cli-i18n-lazy-lookup 实现高效国际化
- Wireshark网络调试工具:中文支持的网口发包与分析