基于朴素贝叶斯分类器的文本分类算法(C语言)

基于朴素贝叶斯分类器的文本分类算法(C语言)

ID:38698983

大小:39.00 KB

页数:7页

时间:2019-06-17

基于朴素贝叶斯分类器的文本分类算法(C语言)_第1页
基于朴素贝叶斯分类器的文本分类算法(C语言)_第2页
基于朴素贝叶斯分类器的文本分类算法(C语言)_第3页
基于朴素贝叶斯分类器的文本分类算法(C语言)_第4页
基于朴素贝叶斯分类器的文本分类算法(C语言)_第5页
资源描述:

《基于朴素贝叶斯分类器的文本分类算法(C语言)》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于朴素贝叶斯分类器的文本分类算法(C语言).txt两个人吵架,先说对不起的人,并不是认输了,并不是原谅了。他只是比对方更珍惜这份感情。#include#include#include//_getcwd(),_chdir()#include//_MAX_PATH,system()#include//_finddata_t,_findfirst(),_findnext(),_findclose()charvocabulary[1000][20];/*声明公

2、有二维数组,用来存储分割好的单词*//*=================将要分类的文本分割成单词存储在二维数组vocabulary中================*///@输入参数:要分类的文本//@输出参数:该文本中总单词数intSplitToWord(chartext[]){inti=0;charseps[]=",.";/*定义单词的分隔符*/char*substring;/******利用分隔符将文本内容分割成单词并存储******/substring=strtok(text,seps);while(substring!=NUL

3、L){strcpy(vocabulary[i],substring);//将单词存储到vocabulary数组中substring=strtok(NULL,seps);i++;}returni;//返回一共多少个单词}/*===============================计算该目录下的文件数================================*///@输入参数:无//@输出参数:该目录下.txt文件数intCountDirectory(){intcount=0;//txt文件计数器longhFile;_finddata

4、_tfileinfo;/********查找.txt文件,记录文件数**********/if((hFile=_findfirst("*.txt",&fileinfo))!=-1L){do{count++;}while(_findnext(hFile,&fileinfo)==0);}returncount;}/*===================================计算某类别中∏P(ai

5、vj)===================================*///@输入参数:分类文本中单词数//@输出参数:该类别下∏P

6、(ai

7、vj)floatCalculateWordProbability(intwordCount){intcountSame;//分类文本中的某单词在所有训练样本中出现次数intcountAll=0;//训练样本中总单词数chartoken;FILE*fp;floatwordProbability=1;//为后面联乘做准备inti,j;longhFile;_finddata_tfileinfo;for(j=0;j

8、findfirst("*.txt",&fileinfo))!=-1L)//对于该类别下每一个.txt文本{do{if((fp=fopen(fileinfo.name,"r"))==NULL)//是否能打开该文本{printf("Sorry!Cannotopenthefile!");exit(0);}/********存储此.txt文件中每个单词并与分类文本的单词作比较*******/while((token=fgetc(fp))!=EOF){charkeyword[1024];i=0;keyword[0]=token;//将每个词第一个字

9、符赋给数组第一个元素while((keyword[++i]=fgetc(fp))!=''&&keyword[i]!='t'&&keyword[i]!=EOF&&keyword[i]!='');//开始读字符,直到遇到空白符,说明找到一个词keyword[i]='';//加结束符countAll++;if(strcmp(keyword,vocabulary[j])==0)//比较两个单词是否相同countSame++;}fclose(fp);}while(_findnext(hFile,&fileinfo)==0);}wordProb

10、ability*=(float)(countSame+1)/(float)(wordCount+countAll)*300;//计算∏P(wj

11、vi),为了扩大效果

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。