在java中开发,识别错别字

用springmvc+ibatis框架实现,主要是做到一个智能的识别

1

4个回答

对于中文来说,识别错别字主要是先分词,然后和词典匹配,看词组是否在字典上存在。

0

要真弄好的话,那不得了。
1.语法库。
2.词组库。
3.语义库。
可以先考虑分词,建议参考一下盘古分词。
附上关于这个问题的讨论,希望有用
http://bbs.csdn.net/topics/390007022

0

首先得有一个字典,然后写一个过滤器,过滤请求中的每个参数。。

0
shifuhetudi
shifuhetudi 会有例子吗?
11 个月之前 回复

楼主你的功能是否实现了。。。

0
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
Java 错别字检查接口 API
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
错别字识别开源API
错别字官网 错别字识别API代码
互联网软件错别字识别系统之初想一
背景 初步设想 数据源 对比过程 词库 结果输出 初步的设想背景:搜狗公布了2017年第一部互联网错别字报告,但是对于一个QA,我们要如何提高自己的错别字能力 1,提升自己的语文水平能力,如果当年语文试题第一题经常不能得分的,可能是个坑 2,提什自己对错别字的敏感度,其实也是一种责任心,错别字可能没多大危害,但是可能是越低级的错误越显得严重。初步设想:我们要用程序的角度去解决这个问题,如何用自动
错别字检查客户端(开源)
错别字检查客户端(开源)
简历有错别字被拒绝聘用?文档被领导说?Python实现永无错别字!
找出中文错别字1.5 代码获取你可以通过下面命令将代码下载到实验楼环境中,作为参照对比进行学习。$ wget http://labfile.oss.aliyuncs.com/courses/828/Document.tar可以预想到,假设我们的语料库长度为 n ,我们可以以 O(1) 的时间复杂度来完成增添条目和查找条目的工作(因为我们给每个单词都设定了ID,所以可以直接访问前后关系对应的内存块)...
错别字分析——自建错词库
前几天帮师兄弄一个错词库,网上找了半天都没有,就自己动手浏览各大论坛、贴吧,自己鼓捣了一个极少的错词库,共200+的错词,分成两个txt文档,有需要的可以拿来下载使用。 文件格式:错误-正确\t[错误]例句\t[正确]例句\n 例子:结帐-结账 喝的差不多了人家来[结帐] 喝的差不多了人家来[结账] 传送门:https://github.com/Rrbsmoy/NLP/tree/maste
JcJc人工智能错别字校对系统API(网站错别字检查)
JcJc人工智能错别字校对系统API - 网站错别字检查 中文校对软件 http://cuobiezi.net/zigen_jiaodui.html Append: 最新版错别字检测 API 地址 https://github.com/textproofreading 网站单页面错别字检查接口说明 接口地址: http://api.CuoBieZi.net/spellchec...
新词添加功能:错别字检查接口 API
新词添加功能:错别字检查接口 API新词添加功能:错别字检查接口 API 接口地址:/spellcheck/add_new_words 必填字段:content 字段内容:需要添加的新词,每次一个新词 如果需要批量新词添加功能 https://github.com/textproofreading http://www.CuoBieZi.net
一个针对现代办公文档中错别字的解决方案:JcJc 错别字在线检查
实际上 70% 的错别字都是可以通过 JcJc 错别字在线识别工具检查出来的. 工具的地只是: http://www.GoDeCms.com .     希望这个工具能帮助到这些白领们,不再受因为错别字带来的负面情绪的影响.
tensorflow错别字检测
引言 当前无论是学术界还是工业界,深度学习都受到极大的追捧,尤其是在Google开源深度学习平台TensorFlow之后,更是给深度学习火上浇油。目前在开源社区Github上所有开源项目中,TensorFlow最为活跃,从推出到现在,经历了几个版本的演进,可以说能够灵活高效地解决大量实际问题。本文主要尝试阐述TensorFlow在自然语言处理(NLP)领域的简单应用,让大家伙儿更加感性地认识Te...
中文错别字在线检查服务
中文错别字在线检查服务      在自媒体的大潮深入人心之后,似乎每个“键盘党”都可以成为作家,在网络上抒发情感, 撰写心得,或总结过去,看到自己的成长;或展望未来,期待自己变得更加优秀;这个时候,难免会因为疏漏出现错别字的情况。       如果博客, 当你发布后,大部分的博客允许你修改,给你保留了后悔的权利;而微博和公众账号的文章则不允许修改,这时候出现错别字,就十分尴尬了。       因此...
JcJc对政府网站公文错别字识别的能力更强了
JcJc对政府网站公文错别字识别的能力更强了
中文汉字错别字纠错方法
前记         本文简单地讲解如何使用n-gram模型结合汉字拼音来作中文错别字纠错,然后介绍最短编辑距离在中文搜索纠错方面的应用;最后从依赖树入手讲解如何作文本长距离纠错(语法纠错),并从该方法中得到一种启示,利用依赖树的特点结合ESA算法来做同义词的查找。 n-gram模型         在中文错别字查错情景中,我们判断一个句子是否合法可以通过计算它的概率来得到,假设一个句子S ...
JcJc人工智能错别字校对系统技术接口文档
文稿校对是一件繁琐、复杂、工作量大、容易出现失误的工作。JcJc人工智 能错别字校对系统就是为了帮助广大文字工作者解决这类问题的一个软件产 品。基于语义分析的中文文本错误的自动侦测与纠错结合大数据的汉语校检 ,我们刻苦研发,目前校对水平正在日益满足各行业文字校对工作的广泛需 求。
微信公众号错别字在线检查工具
微信公众号错别字在线检查工具
自然语言处理-错字识别(基于Python)kenlm、pycorrector
中文文本纠错划分 中文文本纠错任务,常见错误类型包括: 谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺序颠倒,如 伍迪艾伦-艾伦伍迪 字词补全,如爱有天意-假如爱有天意 形似字错误,如 高梁-高粱 中文拼音全拼,如 xingfu-幸福 中文拼音缩写,如 sz-深圳 语法错误,如想象难以-难以想象 当然,针对不同业务场景,这些问题并不一定全部存在,比如输入法中需要处...
政府网站公文中的错别字在线检查工具
可见国务院办公厅政府网站管理部门是十分重视政府网站错别字的情况的。 在此特别推荐一个工具: http://www.godecms.com 政府网站错别字在线检查工具。
论文校对错别字检测工具
论文校对错别字检测工具 2018-4-15 07:35:37 论文校对错别字检测工具 盼望着,盼望着,东风来了,春天的脚步近了。毕业季也到来...
错别字在线检查软件, 拉钩招聘网站出现错别字了
拉钩招聘网站出现错别字了 使用 JcJc 错别字在线检查工具 http://www.godecms.com 拉钩招聘网站出现错别字了
运营好一个自媒体公众号,你还需要一个错别字检查工具
有人说:排版就好比公众号的脸 , 我要说, 错别字就好象脸上的痘痘.
Word文档检查语法错误及错别字
点击审阅>>拼写和语法 2.出现上图所识别对话框,自动显示出可能有问题的地方并且标红,核对并修改之后,点击继续执行,直至文档末端即可。
Python文字识别
利用opencv的简易Python文字识别demo,可能有点小问题,随后会优化
错别字识别功能
目前做文章采集系统,需要对文章扫描,自动识别错别字,这个功能该如何实现呢?rn大家有什么好的思路介绍下,我在百度上搜了下,没有合适的答案,一般就是用word,文本矫正!rn但是通过程序如何去调用呢,没指定的api。rn或者有没有比word更好的软件,能够通过程序访问实现的?
1年来编辑工作中常见的错别字
错字是打不出来的,所以都是别字错(别)字包括音和形 任督二脉 [仁] 噩梦恶梦 让座 [坐]座位 噻 泄露泄漏 揭露 秘诀密决 亲密甜蜜 翻云覆雨 钓鱼钩雨 脚趾甲   指 槽糕   糕点 猥琐 金盘洗手  盆 老三界    届 粘拈花惹草 洗澡海藻 躁动燥     爆燥脾气暴躁 [燥]    火气大 天呐  哪 瑜珈(X)瑜伽  扯淡 [谈]  蛋
JcJc人工智能 错别字检测系统介绍PPT.pdf
基于 280 亿字汉语语料的分析基础 采用 NLP 自然语言语法分析和深度学习相结合的方法 使用汉语切分、汉语依存关系分析技术等中文智能技术 查错准确率和校对效率已经达到一个崭新的高度
错别字检查免费计划! CuoBieZi.net
请大家帮忙转发,支持我的新计划:针对个人用户,错别字检测免费计划! 经过近 18 个月的全力研发,JCJC 错别字检测系统已经基本达到预期目标。大家可以在这里体验: CuoBieZi.NET 。 目前针对个人用户,每年收费:30 元每人 ( 定价说明: https://zhuanlan.zhihu.com/p/32677700 ) ,这个费用是公益价格,仅仅能覆盖租用服务器的成本。(以这...
Elasticsearch 遇到的问题汇总
前段时间一直在研究ES(Elasticsearch简称)集群,故难免会遇到一些问题,现就遇到的问题做下深入的分析和总结。在分析之前我们先对ES集群中涉及到的关键名词进行了解。 一 ES集群比较重要名词解释    1)shards      shards指的是索引分片的大小,一个大的索引被分为若干个分片后,存储于不同的节点上以构成分布式搜索。分片不一定是越多越好,分片数量要按自己的
使用HMM隐式马尔科夫链实现基于拼音的文本纠错
HMM实现基于拼音的文本纠错 文章将从以下4个小节进行描述: 1.问题描述 2.思路 3.源码 4.应用 1.问题描述 对于歌曲的语音搜索实现方案之一如下。 使用百度语音进行用户语音识别,返回的字符串调用歌词搜索,而歌词搜索使用的是分词的方式进行的索引建立,因此字符串识别的准确率直接影响最后返回歌曲的正确性。 而百度语音是基于非特定样本
Java基础2.0(纯手打的,个别错别字请包涵)
一、    变量的作用        变量就是可以被改变的量(数据),可大可小可长可短能伸能缩。        在JAVA中我们通过三个元素来描述变量:变量类型,变量名以及变量值。        使用等号来赋值,如:int i = 10;            1)变量的数据类型为:int            2)变量名为(名字可以参照下面取名规范取名):i            3)赋值符号:...
如何提高ABBYY FineReader的识别正确率
在OCR文字识别软件当中,ABBYY FineReader是比较好用的程序之一,但再好的识别软件也不能保证100%的识别正确率,用户都喜欢软件的正确率高一些,以减轻识别后修正的负担。
错别字检测Windows 10客户端
https://zhuanlan.zhihu.com/p/50742886 JCJC错别字检测Windows客户端,Download 下载链接 :https://share.weiyun.com/5DUoLOV ( 腾讯QQ微云分享 ) 这是一个绿色的版本,对系统要求如下: Windows 10 系统;系统中需要安装 Office 2013或以上版本;需要安装微软 .net framework 4.6 或以上版本;
JCJC错别字检测Windows客户端发布了
JCJC错别字检测Windows客户端发布了 经过长时间的准备,JCJC错别字检测Windows客户端发布了.   JCJC错别字检测Windows客户端,Download 下载链接 :https://share.weiyun.com/5DUoLOV ( 腾讯QQ微云分享 ) 这是一个绿色的版本,对系统要求如下: Windows 10 系统; 系统中需要安装 Office 2013或以...
超级好用神器,识别率极高~截图文字识别,错误率很低,别错过!
F4是开启截图,识别文字,出结果。可能会有错别字,但极少~
000.错别字专项训练答案**错别字专项训练答案**错别字专项训练答案
错别字专项训练答案..错别字专项训练答案..错别字专项训练答案..错别字专项训练答案
【NLP】单词纠错——python小练习
原文来自:How to write a spelling corrector起源本文翻译自大牛 Peter Norvig 的博文,作为本渣渣技术博客的第一篇内容,熟悉一下这个博客的操作哈~意思就是大牛自己的两个大牛朋友问大牛,为什么谷歌的拼写检查功能这么厉害,大牛很惊讶,为什么这么厉害的两个工程师+数学家竟然不懂这种简单的算法原理吗?看来此时只能本大牛写一个简单的解释让大家能够从中获得一些有益的启发
JcJc错别字纠错检查API说明
http 请求地址: http://www.cuobiezi.net/api/v1/zh_spellcheck/json http 请求方式: POST http 发送标准的 Form 请求表单, 需要的 POST 字段: content: 字段值: 需要检查的文本。 check_mode: 字段值,固定为: advanced action: 字段值,固定为:show
【Python3-API】通用文字识别示例代码
Python3-urllib3-API通用OCR示例代码 AccessToken获取可以参考:http://ai.baidu.com/forum/topic/show/497663(Python3-urllib3示例)Python安装什么的。大家百度经验即可 -----------------------------------------------------下面开始代码-------
字根科技-政府网站错别字检测云主机共享联盟计划
字根科技-政府网站错别字检测云主机共享联盟计划 中新网11月30日电 据中国政府网消息,国务院办公厅政府信息与政务公开办公室近期组织开展了2017年第三季度全国政府网站抽查。抽查结果显示,部分网站存办事功能不实用等问题。各地区各部门加大对不合格政府网站责任单位和人员的问责力度,183名有关责任人被上级主管单位约谈,33人作出书面检查,11人被通报批评,6人受到警告或记过处分,5人被调离岗位或...
网络时代,错别字流行,汉字终将退化为表音符号
网络上的各种错别字流行。 人们不再区分“在”“再”的区别。不在,不再。啊,阿。 还有很多这样的例子(一下子想不起来)。遍布论坛和blog。标题中的错字也不屑于修改。 习以为常之后,就会忘记一些汉字的本意。 错别字流行到一定程度,就会成为通假字。很多同音字可能因此消失。 ---------------------------------------- 危言耸听。 -...
云南昆-大-丽-香
原文地址:云南昆-大-丽-香 (来自@轻博客) 作者:唔明卤
文章热词 Java后端服务开发 Java Java教程 tensorflow猫狗识别任务 tensorflow猫狗识别网络架构
相关热词 c#识别图片中的文字 jsp文件中不识别bootstrap android 拍照识别身份中 python识别股票价格 python识别手写数字教程