萨格勒布大学布隆过滤器实现：多语言数据结构课程项目

需积分: 9 71 浏览量更新于2024-11-04 1 收藏 29.49MB ZIP 举报

资源摘要信息:"本文档是关于布隆过滤器（Bloom Filter）的实现，这是萨格勒布大学电气工程与计算学院生物信息学课程的一部分。布隆过滤器是一种空间效率很高的随机数据结构，用于判断一个元素是否在一个集合中。它能够提供一种判断元素是否在集合中的有效方法，同时具有很高的概率判断错误，即把不在集合中的元素错误地认为在集合中（假阳性），但是不会判断出错的元素不在集合中。该文档提到的布隆过滤器实现包含五种版本，分别是使用C语言、C#语言、Python语言以及两个版本的Java语言编写的。这些实现被存储在同一个存储库中，每个实现位于以特定格式命名的文件夹中，格式为“Name_BloomFilter_ProgramingLanguageUsedForImplementation”。具体到Java实现，文档介绍了名为DamirBloomFilterJava的应用程序。应用程序的安装和启动步骤如下： 1. 下载存储库； 2. 下载并安装Java 8。安装步骤可以在***找到详细指南； 3. 继续按照提供的指南完成安装和配置。在计算机科学中，布隆过滤器由Bloom在1970年提出，它使用多个哈希函数来映射元素到一个大的位数组中。尽管它会允许一定的错误率，但其占用的空间远比哈希表等数据结构要小，因此在不需要完全精确的场景下非常有用。布隆过滤器广泛应用于网络浏览器检查缓存、数据库系统检查重复记录、分布式系统进行成员资格检查等场景。布隆过滤器的实现关键在于选择合适的位数组大小和哈希函数的数量。位数组大小决定了布隆过滤器的误报概率，哈希函数的数量决定了插入和查询的效率。理论上，误报概率可以通过以下公式估算：误报概率 = (1 - e^(-kn/m))^k 其中，k是哈希函数的数量，n是插入元素的数量，m是位数组的大小。在实际应用中，为了实现布隆过滤器，需要考虑以下几点： - 如何初始化位数组，可以采用全0的方式； - 如何选择多个独立的哈希函数，这些函数应该尽可能随机分布； - 如何实现插入（add）和查找（contains）方法，插入方法用于向布隆过滤器添加元素，而查找方法用于判断元素是否可能存在于布隆过滤器中。布隆过滤器的Java实现，如DamirBloomFilterJava，就是依据以上原理，为Java语言用户提供了一个方便的工具，让他们可以轻松地在自己的Java项目中集成布隆过滤器功能，以便在需要的场合使用。由于布隆过滤器的性质，它在生物信息学以外的领域也大有作为，例如在大规模数据处理和缓存系统设计中，能显著减少存储空间的需求，提高数据处理的速度。"

收起资源包目录

Bloom-Filter-Implementation:作为萨格勒布大学电气工程与计算学院生物信息学课程的一部分，实现布隆过滤器数据结构，https （140个子文件）

BloomFilter.csproj 2KB

BloomFilter.dll 8KB

.classpath 295B

TestFileReader.java 2KB

TestStringProcessor.java 779B

FastaStringProcessor.class 1KB

BloomFilterImplTest.jar 9KB

BloomFilter.dll 8KB

AssemblyInfo.cs 988B

AssemblyInfo.cs 982B

Extensions.cs 2KB

TestApp.jar 7KB

eschericia-part.fa~ 4.43MB

FowlerNollVo1AlternateHash.java 526B

main.o 3KB

BloomFilter.dll 8KB

test_generator.jar 2KB

Hasher.class 2KB

TestHasher.class 2KB

bloom_filter.o 7KB

FilipBloomFilterCSharp-Linux.tar.gz 6KB

FASTAReader.cs 2KB

FastaStringProcessor.java 718B

LICENSE 1KB

BloomFilterMain.java 6KB

BloomFilterBitSet.java 987B

eschericia.fa 4.43MB

FastaFileReader.java 1KB

eschericia-part.fa 1KB

HashFunction.java 213B

MurmurHash.java 2KB

hash_funs.o 4KB

TestWorker.java 2KB

BloomFilter.java 7KB

GenomeBloomFilterGCC.layout 1KB

eschericia-part.fa~ 1KB

hash_funs.o 830B

BloomFilter.dll 6KB

GenomeBloomFilterGCC.exe 12KB

BloomFilter.java 3KB

Program.cs 8KB

bloom_filter.c 3KB

bloom_filter.o 3KB

README.md 0B

AssemblyInfo.cs 988B

main.o 5KB

BloomFilter.dll 8KB

.gitignore 203B

Hasher.java 3KB

BloomFilter.dll.mdb 2KB

eschericia.fa 4.43MB

FakeHash.java 1KB

FASTAReader.cs 1KB

test_main.c 3KB

BloomFilterApp.csproj 2KB

BloomFilter.class 3KB

README.md 5KB

BloomFilterUnitTests.dll 5KB

Program.cs 14KB

Hashes.cs 3KB

AssemblyInfo.cs 979B

BloomFilterUnitTests.cs 2KB

org.eclipse.jdt.core.prefs 587B

BloomFilterApp.exe.mdb 615B

BloomFilterStructureShowcase.jar 10KB

README.md 445B

BloomFilterApp.exe 4KB

TestBloomFilter.class 3KB

BloomFilterPerfTests.csproj 2KB

PerformanceTest.java 6KB

eschericia-part.fa 1KB

TestHasher.java 3KB

hash_funs.c 2KB

Packages.mdproj 2KB

GenomeBloomFilterGCC.cbp 1KB

BloomFilter.dll.mdb 3KB

TestBloomFilter.java 3KB

TestStringProcessor.class 1KB

BloomFilterApp.exe.mdb 2KB

eschericia.fa 4.43MB

bloom_filter.h 816B

BloomFilterApp.exe 8KB

hash_funs.h 327B

GenomeBloomFilterGCC.exe 42KB

BloomFilterUnitTests.csproj 2KB

TestWorker.class 3KB

BloomFilter.cs 5KB

BloomFilter.dll.mdb 2KB

GenomeBloomFilterGCC.depend 978B

FastaFileReader.class 2KB

BloomFilter.dll 6KB

tomoHashes.cpp 2KB

BloomFilterPerfTests.exe.mdb 923B

FastaWorker.class 2KB

ShowcaseFilterApp.jar 5KB

main.c 3KB

BloomFilterUnitTests.dll.mdb 747B

FastaWorker.java 2KB

.gitignore 340B

TestFileReader.class 2KB

共 140 条

moseswangbp981

粉丝: 35
资源: 4637

萨格勒布大学布隆过滤器实现：多语言数据结构课程项目

bloom filter(C#版自制布隆过滤器)

Go-布隆过滤器的一个Go实现参考bloomfilter.js

布隆过滤器C源码-bloomfilter.rar

布隆过滤器 bloom filter：

C++布隆过滤器库函数

redission实现布隆过滤器

Java代码如何实现布隆过滤器

代码实现redisson实现的布隆过滤器

redisson实现布隆过滤器

布隆过滤器在 Guava 中的实现是 Bloomfilter

最新资源