抄袭检测程序功能要求：给定两个字符长度为1000的字符串，对A字符串的内容进行抄袭检测。如果发现A字符与B字符中连续6个字符相同，则统计抄袭字数为6，当全部检测完毕后，统计出抄袭字数占A字符的比率；显示所有抄袭部分文字；要求使用两种不同的方法进行处理；用C语言数据结构，并将两个代码合并成一个代码

以下是使用两种不同方法进行抄袭检测的C语言代码合并版： ```c #include <stdio.h> #include <string.h> #define MAX_LENGTH 1000 // 定义字符串最大长度 // 方法一：暴力匹配 float check_plagiarism_1(char* A, char* B) { int plag_count = 0; // 抄袭字数统计 float plag_ratio; // 抄袭比率 char plag_text[MAX_LENGTH] = ""; // 抄袭部分文字 int i, j, k; int A_length = strlen(A); int B_length = strlen(B); for (i = 0; i < A_length; i++) { // 遍历A字符串 for (j = 0; j < B_length; j++) { // 遍历B字符串 if (A[i] == B[j]) { // 如果字符相同 for (k = 1; k < 6; k++) { // 向后匹配5个字符 if (A[i+k] != B[j+k]) { break; // 如果不相同，跳出循环 } } if (k == 6) { // 如果匹配成功 plag_count += 6; // 抄袭字数加6 strncat(plag_text, &A[i], 6); // 抄袭部分文字添加到plag_text中 } } } } plag_ratio = (float)plag_count / A_length; // 计算抄袭比率 printf("方法一：\n"); printf("抄袭字数：%d\n", plag_count); printf("抄袭比率：%f\n", plag_ratio); printf("抄袭部分文字：%s\n", plag_text); return plag_ratio; } // 方法二：哈希匹配 float check_plagiarism_2(char* A, char* B) { int plag_count = 0; // 抄袭字数统计 float plag_ratio; // 抄袭比率 char plag_text[MAX_LENGTH] = ""; // 抄袭部分文字 int i, j; int A_length = strlen(A); int B_length = strlen(B); const int base = 131; // 哈希算法的进制数 long long A_hash[MAX_LENGTH] = {0}; // 存储A字符串前缀的哈希值 long long B_hash; // 存储B字符串子串的哈希值 long long power[MAX_LENGTH] = {0}; // 存储进制的幂次方 power[0] = 1; // 第一个幂次方为1 for (i = 1; i < A_length; i++) { power[i] = power[i-1] * base; // 计算进制的幂次方 } A_hash[0] = A[0]; // 第一个字符的哈希值为本身 for (i = 1; i < A_length; i++) { A_hash[i] = A_hash[i-1] * base + A[i]; // 计算前缀的哈希值 } for (i = 0; i < B_length-5; i++) { // 遍历B字符串子串 B_hash = 0; // 子串的哈希值初始化为0 for (j = 0; j < 6; j++) { B_hash = B_hash * base + B[i+j]; // 计算子串的哈希值 } for (j = 0; j < A_length-5; j++) { // 遍历A字符串前缀 if (B_hash * power[j] == A_hash[j+5] - A_hash[j] * power[5]) { // 如果哈希值相同 plag_count += 6; // 抄袭字数加6 strncat(plag_text, &A[j], 6); // 抄袭部分文字添加到plag_text中 } } } plag_ratio = (float)plag_count / A_length; // 计算抄袭比率 printf("方法二：\n"); printf("抄袭字数：%d\n", plag_count); printf("抄袭比率：%f\n", plag_ratio); printf("抄袭部分文字：%s\n", plag_text); return plag_ratio; } int main() { char A[MAX_LENGTH], B[MAX_LENGTH]; // 定义两个字符串 float plag_ratio_1, plag_ratio_2; // 抄袭比率 printf("请输入A字符串："); fgets(A, MAX_LENGTH, stdin); printf("请输入B字符串："); fgets(B, MAX_LENGTH, stdin); A[strlen(A)-1] = '\0'; // 去掉fgets函数自动添加的换行符 B[strlen(B)-1] = '\0'; plag_ratio_1 = check_plagiarism_1(A, B); plag_ratio_2 = check_plagiarism_2(A, B); if (plag_ratio_1 > plag_ratio_2) { printf("\n方法一检测到的抄袭比率更高！\n"); } else if (plag_ratio_1 < plag_ratio_2) { printf("\n方法二检测到的抄袭比率更高！\n"); } else { printf("\n两种方法检测到的抄袭比率相同！\n"); } return 0; } ```

阅读全文

相关推荐

一个对字符串处理的程序，要求能够识别字符串中大写字母、小写字母以及数字的个数并输出，识别“L”、“o”、“v”、“e”四个字符的

C语言程序设计-分别统计字符串中字母、数字、空格和其他字符出现的次数（字符长度小于80）;.c

判断两段程序之间是否存在抄袭

字符串比较与处理：给定两个字符串 s 和 t 的实用指南.zip

回文：检测给定的字符串是否为回文

NLengthKLength:从给定的长度为K的字符串中生成所有N个长度的字符串

Permutations-of-the-characters-in-a-string-Java:给定一个字符串，程序将打印其字符的所有可能排列

big-integer-min:给定两个有效的字符串形式的整数，返回两个中较小的一个

big-integer-max:给定两个有效的字符串形式的整数，返回两个中较大的一个

最大公共字符串leetcode-longest-palindromic-substring:给定一个字符串s，找出s中最长的回文子串。你可以假

leetcode438-LeetCode438_Find_All_Anagrams_in_String:438题目：给定一个字符串s和一个非空

Edit-Distance-Problem:给定两个字符串str1和str2以及以下可以在str1上执行的操作。 查找将'str1'转换为'str2'所需的最少编辑（操作）次数。

最长二进制 1 的字符串检测：此代码检测任何给定字符串中最长的 1 字符串-matlab开发

SubString-Queries---Anagram-:给定一个字符串 S，回答 Q 个查询。 每个查询都包含一个字符串 qstr。 请输出 S 中包含某个 qstr 字谜的子串数作为子序列

starts-with-any:如果给定的字符串或数组以任何给定的子字符串开头，则返回true

ends-with-any:如果给定的字符串或数组以任何给定的子字符串结尾，则返回true

java源码文档-StringPlagiarism:字符串匹配：抄袭检测，给定文档与现有文档集进行matched窃检测匹配，并提供output

fix-random:为给定的字符串生成固定随机数

Combination:一个计算给定字符串中所有字符组合的程序

大家在看

2_JFM7VX690T型SRAM型现场可编程门阵列技术手册.pdf

网络信息系统应急预案-网上银行业务持续性计划与应急预案

RK eMMC Support List

DAQ97-90002.pdf

毕业设计&课设-MATLAB的光场工具箱.zip

最新推荐

python简单算法04：判断一个字符串是否为回文串的排列之一

java实现字符串匹配求两个字符串的最大公共子串

JavaScript中两个字符串的匹配

C语言实现输入一个字符串后打印出该字符串中字符的所有排列

Python简单实现查找一个字符串中最长不重复子串的方法

免费下载可爱照片相框模板

【IE11停用倒计时】：无缝迁移到EDGE浏览器的终极指南（10大实用技巧）

STC8H8K64U 精振12MHZ T0工作方式1 50ms中断 输出一秒方波

易语言中线程启动并传递数组的方法

【PCB设计速成】：零基础到专家的电路板设计全面攻略

Edit-Distance-Problem:给定两个字符串str1和str2以及以下可以在str1上执行的操作。查找将'str1'转换为'str2'所需的最少编辑（操作）次数。

SubString-Queries---Anagram-:给定一个字符串 S，回答 Q 个查询。每个查询都包含一个字符串 qstr。请输出 S 中包含某个 qstr 字谜的子串数作为子序列

STC8H8K64U 精振12MHZ T0工作方式1 50ms中断输出一秒方波