东南大学崇志宏:非结构数据存储与区块链数据库的探索与挑战

需积分: 50 33 下载量 199 浏览量 更新于2024-07-19 收藏 1.88MB PDF 举报
东南大学数据与智能实验室(D&IntelLab)的崇志宏教授在此次交流中探讨了非结构数据存储和区块链数据库的关键问题。非结构数据,如知识图谱、文本、图片和视频,由于其复杂性和多样性,已经成为现代互联网环境中数据存储和访问的重要挑战。其中,处理的关键点在于: 1. **模型开放**:随着数据的开放性增强,如何保证模型的透明度和互操作性是首要问题,这涉及到数据格式、标准和接口的设计,以便不同系统间的兼容与协同。 2. **数据一致性与共识性**:在开放环境下,确保数据在多个节点或分布式系统中的同步和一致性至关重要。这不仅要求有高效的数据同步机制,还涉及共识算法来达成数据的共同认定,如在区块链中通过工作量证明(PoW)或权益证明(PoS)达成共识。 3. **key-value模型上的数据存储**:针对非结构数据,特别是知识图谱,key-value存储模型需要适应动态和变长记录的存储需求,同时提供高效的查询支持,如聚集存储、并发访问以及相似性或相关性的检索。 崇志宏教授的研究团队,如智慧城市信息融合研究中心,利用区块链、大数据和人工智能技术,专注于知识图谱的处理。他们开发的技术和方法包括但不限于: - **知识图谱的分布存储**:实现数据的聚集存储和并发访问,支持相似和相关性检索,以及动态结构和变长记录的高效管理。 - **区块链数据库的去中心化和共识性**:借助区块链技术,实现数据的不可篡改和透明性,通过共识算法确保数据的一致性。 - **知识图谱的分割和聚合**:对大规模知识图谱进行有效分割,提高查询性能,并能处理实时事件,如敌我飞机飞行轨迹分析。 - **知识图谱的存储与访问**:如使用HBase存储和Spark SPARQL接口,支持知识抽取、图谱构建和维护,以及语义搜索功能。 此外,崇志宏团队还与国防科研机构合作,如中国电子集团28所,共同开展军事知识图谱的构建、信息集成,以及语义搜索和情报分析模型库的研发,助力国防信息化建设。 崇志宏教授的研究关注的是如何通过先进的信息技术解决非结构数据存储的难题,尤其是利用区块链技术提升数据的安全性、可靠性和效率,以适应不断发展的互联网环境和智能应用的需求。