中文地址识别及标准化处理方法任务书

 2021-08-20 23:23:56

1. 毕业设计(论文)主要内容:

地址是一个涵盖丰富信息的变量,但长期以来由于中文处理的复杂性、国内中文地址命名的不规范性,使地址中蕴含的丰富信息不能被深度分析挖掘。通过对地址进行标准化的处理,使基于地址的多维度量化挖掘分析成为可能,为不同场景模式下的电子商务应用挖掘提供了更加丰富的方法和手段,因此具有重要的现实意义。本课题主要内容:1)根据需要,对提供的数据样本进行清洗;2)建立标准化算法,对提供的地址进行标准化和识别;3)对上述结果结合相关知识作出一定的合情合理的分析,提交较为详细的分析报告(包含模型和算法的自评标准)、程序源码等。

2. 毕业设计(论文)主要任务及要求

1.查阅15篇相关文献(含近五年外文3篇),并每篇书写200—300字文献摘要(装订成册,带封面);2.认真填写周记,完成800字开题报告;3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);4.完成系统的编码与调试;5.完成10000字以上的毕业论文;6.进行论文答辩。

3. 毕业设计(论文)完成任务的计划与安排

(1)2016/1/11—2016/1/22:查阅参考文献,明确选题;

(2)2016/1/23—2016/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;

(3)2016/3/8—2016/4/26:需求分析,算法或系统设计,分析、比较或实现等;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

1. 大数据时代-生活、工作与思维的大变革,[英]维克托.迈尔-舍恩伯格等,浙江人民出版社,2013.

2. 王斌译,大数据:互联网大规模数据挖掘与分布式处理,人民邮电出版社,2012年,第一版。

3.韩家炜等著。数据挖掘概念与技术,机械工业出版社,2007,第一版。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。