BufferedMutatorParams

BufferedMutatorParams 是 HBase Java 客户端库提供的一个类，用于配置和创建 BufferedMutator 对象。BufferedMutator 是一个用于批量写入数据的高级接口，它可以将多个 HBase 写入操作缓冲在内存中，然后批量发送到服务器，以提高写入性能。 BufferedMutatorParams 类提供了以下配置选项： - TableName：指定要写入的 HBase 表名。 - ExecutorService：指定用于异步写入操作的线程池。 - WriteBufferPeriodicFlushTimeoutMs：指定缓冲区刷新的时间间隔（毫秒）。 - WriteBufferSize：指定缓冲区的大小（字节）。 - MaxKeyValueSize：指定单个写入操作的最大键值对大小限制。通过配置 BufferedMutatorParams 对象的属性，可以根据需求调整 BufferedMutator 的行为，以实现更高效的数据写入操作。

BufferedMutatorParams params = new BufferedMutatorParams(TableName.valueOf("sensor_fuelgas_history")); //设置缓存大小 params.writeBufferSize(10 * 1024 * 1024L); mutator = connection.getBufferedMutator(params); // 存入数据 Put put = new Put(datas.getId().getBytes()); put.addColumn("info".getBytes(), "operaterTime".getBytes(), datas.getOperaterTime().getBytes()); put.addColumn("info".getBytes(), "deviceId".getBytes(), datas.getDeviceId().getBytes()); put.addColumn("info".getBytes(), "signal".getBytes(), datas.getSignal().getBytes()); put.addColumn("info".getBytes(), "voltage".getBytes(), datas.getVoltage().getBytes()); put.addColumn("info".getBytes(), "temperature".getBytes(), datas.getTemperature().getBytes()); put.addColumn("info".getBytes(), "concentration".getBytes(), datas.getConcentration().getBytes()); put.addColumn("info".getBytes(), "state".getBytes(), datas.getState().getBytes()); put.addColumn("info".getBytes(), "distance".getBytes(), datas.getDistance().getBytes()); put.addColumn("info".getBytes(), "communityIdentity".getBytes(), datas.getCommunityIdentity().getBytes()); put.addColumn("info".getBytes(), "alarm".getBytes(), datas.getAlarm().getBytes()); put.addColumn("info".getBytes(), "reserved".getBytes(), datas.getReserved().getBytes()); put.addColumn("info".getBytes(), "submitTime".getBytes(), datas.getSubmitTime().getBytes()); put.addColumn("info".getBytes(), "lat".getBytes(), datas.getLat().getBytes()); put.addColumn("info".getBytes(), "lon".getBytes(), datas.getLon().getBytes()); put.addColumn("info".getBytes(), "acceptTime".getBytes(), datas.getAcceptTime().getBytes()); put.addColumn("info".getBytes(), "errorConcentration".getBytes(), datas.getErrorConcentration().getBytes()); put.addColumn("info".getBytes(), "errorState".getBytes(), datas.getErrorState().getBytes()); put.addColumn("info".getBytes(), "tmp".getBytes(), datas.getTmp().getBytes()); put.addColumn("info".getBytes(), "wea".getBytes(), datas.getWea().getBytes()); put.addColumn("info".getBytes(), "newtmp".getBytes(), datas.getNewtmp().getBytes()); listPut.add(put); if(listPut.size()>=3000){ mutator.mutate(listPut); mutator.flush(); listPut.clear(); count = count - 1; } if(count == 0 && remain ==listPut.size()){ mutator.mutate(listPut); mutator.flush(); listPut.clear(); } 写入hbase时间太长优化下

要优化写入HBase的时间，可以考虑以下几点： 1. 调整写缓冲区大小：根据实际情况，适当调整写缓冲区的大小，以提高写入性能。在上述代码中，已经设置了写缓冲区大小为10MB，可以根据数据的大小和网络状况进行调整。 2. 批量写入数据：在上述代码中，使用了一个List来存储Put对象，当List中的元素达到一定数量时，才进行批量写入和刷新操作。这样可以减少网络传输的次数，提高写入性能。可以根据实际情况调整批量写入的阈值。 3. 多线程并发写入：可以考虑使用多线程并发进行数据写入操作，以提高写入性能。可以将数据分成多个批次，每个批次由一个线程负责写入，然后再进行合并。 4. 使用异步写入：HBase提供了异步写入的功能，可以将写入操作放入异步队列中，在后台进行批量写入。这样可以减少等待时间，提高写入性能。 5. 调整HBase配置：根据实际情况，可以调整HBase的相关配置参数，如RPC重试策略、RPC重试暂停时间等，以优化写入性能。需要根据具体的场景和需求进行优化，可以结合以上几点进行尝试，以提高写入HBase的性能。

flink 自定义hbasesink 批量写入数据到hbase

如果你想使用 Flink 批量将数据写入 HBase，可以自定义一个 HBaseSinkFunction。下面是一个简单的示例： ```java public class HBaseBatchSinkFunction extends RichSinkFunction<List<Tuple2<String, String>>> { private transient Connection connection; private transient BufferedMutator bufferedMutator; @Override public void open(Configuration parameters) throws Exception { Configuration config = HBaseConfiguration.create(); config.set("hbase.zookeeper.quorum", "localhost"); config.set("hbase.zookeeper.property.clientPort", "2181"); config.set("zookeeper.znode.parent", "/hbase"); config.set("hbase.client.write.buffer", "10000000"); config.set("hbase.client.retries.number", "3"); connection = ConnectionFactory.createConnection(config); TableName tableName = TableName.valueOf("my_table"); BufferedMutatorParams params = new BufferedMutatorParams(tableName); params.writeBufferSize(1024 * 1024); bufferedMutator = connection.getBufferedMutator(params); } @Override public void invoke(List<Tuple2<String, String>> values, Context context) throws Exception { List<Put> puts = new ArrayList<>(); for (Tuple2<String, String> value : values) { Put put = new Put(Bytes.toBytes(value.f0)); put.addColumn(Bytes.toBytes("my_cf"), Bytes.toBytes("my_col"), Bytes.toBytes(value.f1)); puts.add(put); } bufferedMutator.mutate(puts); } @Override public void close() throws Exception { if (bufferedMutator != null) { bufferedMutator.flush(); bufferedMutator.close(); } if (connection != null) { connection.close(); } } } ``` 在这个自定义的 HBaseSinkFunction 中，我们使用 BufferedMutator 批量写入数据。在 open() 方法中，我们获取 HBase 连接和缓冲器。在 invoke() 方法中，我们将数据转换为 Put 对象，并添加到缓冲器中。最后，在 close() 方法中，我们刷新缓冲器并关闭连接。在你的 Flink 程序中，你可以使用这个自定义的 HBaseSinkFunction，例如： ```java DataStream<Tuple2<String, String>> dataStream = ...; dataStream.addSink(new HBaseBatchSinkFunction()); ``` 这样，你就可以批量将数据写入 HBase 了。

BufferedMutatorParams

flink 自定义hbasesink 批量写入数据到hbase

相关推荐

BufferedMutator

java基于ssm+jsp一家运动鞋店的产品推广网站系统源码 带毕业论文

51单片机Proteus仿真LCD1602+DS18B20的温度读取显示编程.rar

暴风电视 50F1 配屏V500HJ1-PE8(C3) 机编600000MWV00 屏参30162503 风UI1.0 本地升级

【高创新】基于蚁狮优化算法ALO-Transformer-BiLSTM实现故障识别Matlab实现.rar

java基于ssm+vue儿童影楼拍摄管理系统源码 带毕业论文

复杂网络建模-无向图(ER、WS、BA、RR)

VB企业人事管理系统设计与实现(开题报告+源代码+系统).zip

【高创新】基于鲸鱼优化算法WOA-Transformer-BiLSTM实现故障识别Matlab实现.rar

Matlab simulink仿真，直驱永磁风机并网chopper低电压穿越，版本matlab2018a

http服务器的实现.7z

【高创新】基于雾凇优化算法RIME-Transformer-LSTM实现故障识别Matlab实现.rar

vb+access电脑销售系统(论文+系统).zip

4-3_Education_ORANGE_2017_01.potx

java基于ssm+jsp小区物业管理系统源码 带毕业论文+PPT

【高创新】基于蝗虫优化算法GOA-Transformer-LSTM实现故障识别Matlab实现.rar

【高创新】基于阿基米德优化算法AOA-Transformer-LSTM实现故障识别Matlab实现.rar

最新推荐

java基于ssm+jsp一家运动鞋店的产品推广网站系统源码 带毕业论文

51单片机Proteus仿真LCD1602+DS18B20的温度读取显示编程.rar

暴风电视 50F1 配屏V500HJ1-PE8(C3) 机编600000MWV00 屏参30162503 风UI1.0 本地升级

【高创新】基于蚁狮优化算法ALO-Transformer-BiLSTM实现故障识别Matlab实现.rar

java基于ssm+vue儿童影楼拍摄管理系统源码 带毕业论文

WebLogic集群配置与管理实战指南

管理建模和仿真的文件

Python列表操作大全：你不能错过的10大关键技巧

编写完整java程序计算"龟兔赛跑"的结果，龟兔赛跑的起点到终点的距离为800米，乌龟的速度为1米／1000毫秒，兔子的速度为1.2米／1000毫秒，等兔子跑到第600米时选择休息120000毫秒，请编写多线程程序计算龟兔赛跑的结果。

AIX5.3上安装Weblogic 9.2详细步骤

java基于ssm+jsp一家运动鞋店的产品推广网站系统源码带毕业论文

java基于ssm+vue儿童影楼拍摄管理系统源码带毕业论文

java基于ssm+jsp小区物业管理系统源码带毕业论文+PPT

java基于ssm+jsp一家运动鞋店的产品推广网站系统源码带毕业论文

java基于ssm+vue儿童影楼拍摄管理系统源码带毕业论文