大数据观察者张宏江:CBIR与未来趋势探讨
需积分: 10 155 浏览量
更新于2024-07-24
收藏 2.85MB PDF 举报
在张宏江的"关于大数据的观察与思考"一文中,他以CBIR(Content-Based Image Retrieval,基于内容的图像检索)作为切入点,探讨了大数据时代下这一技术领域的变革和发展。CBIR系统的基石包括Query Formation(查询形成)、Results Presentation(结果展示)、Ranking(排序)以及Indexing(索引构建),其中关键挑战在于如何解决User Intention Gap(用户意图差距)和Semantic Gap(语义差距)。用户可能不准确地表达他们的搜索意图,而机器可能无法完全理解图片的深层含义,这要求开发自动概念分类器和图像标注模型来跨越这两者之间的鸿沟。
张宏江指出,传统的CBIR系统依赖于特征向量来表示图像内容,但如何将这些特征映射到具有语义意义的单词或模型上是一个问题。他提倡将特征组视为单词,并通过词法分析来增强理解。文章中提到的问题包括数据不足,即在互联网海量数据背景下,如何获取足够多的标注信息以提升模型性能。同时,互联网的发展,如社交网络(如Flickr、腾讯Qzone、美图秀秀、Facebook、Twitter、微信等)和云存储服务(如Dropbox、金山快盘和金山云)极大地推动了照片分享,导致数据爆炸性增长,对CBIR技术提出了新的挑战。
文中列举了Flickr上有80亿张照片存储的例子,以及腾讯Qzone拥有超过1500亿张照片,这些数据表明了大数据在推动CBIR进步的同时,也带来了前所未有的数据处理压力。面对这种变化,张宏江提出需要研究如何利用机器学习方法,例如IBM的QBIC(Query By Image Content,基于图像内容的查询)等技术,来处理和理解这些海量数据,以提升图像检索的准确性和效率。
张宏江在文章中强调了大数据背景下CBIR面临的机遇和挑战,探讨了如何通过技术创新解决用户意图识别、语义理解和海量数据处理等问题,这对于IT行业尤其是图像检索和人工智能领域的发展具有重要的启示意义。
109 浏览量
163 浏览量
2012-04-25 上传
2021-01-30 上传
2022-03-13 上传
点击了解资源详情
137 浏览量
点击了解资源详情
点击了解资源详情
tt_baby2012
- 粉丝: 0
- 资源: 1
最新资源
- B2C_UQ云商系统 v1.3.1
- FrontEnd:回购协议
- StocksEvolutionApp:python实现的应用程序,使用bokeh来显示和操纵股票图
- Javaweb+mybatis+Springboot+SpringMVC活动拼团项目
- 飞机大战初级版
- 新建文件夹,新建文件夹2,matlab
- personal_portfolio:使用HTML,CSS,JS和AOS创建的个人投资组合网站,用于存储个人项目和文件以显示给朋友,家人和未来的雇主
- RoveClone:罗夫克隆
- Registry Finder(注册表管理)2.53 中文绿色版
- AnchorBooks
- AvalonDock的基本用法
- ATM-MACHINE-CODE:带有纯PYTHON的简单后端ATM代码
- 行业文档-设计装置-高压线路检修作业平台.zip
- html5 canvas模拟的见缝插针小游戏源码
- opentelemetry-指标收集和分布式跟踪框架-Rust开发
- WTAB-Wp-Pnl:我在WordPress中创建设置面板的基本插件