我正在做手写字符识别执行后我得到了这样的输出
我的目标是预测输出图像文件(如测试(的字符,我使用了这个 k 均值文件
任何人都可以帮助我预测输出图像的特征。这将帮助我提前在我的项目中继续进一步的步骤。
执行 OCR 需要相当大的现有字母训练集,以便对 k 均值进行操作。在此应用程序中使用 k 均值将涉及对图像本身进行聚类(单个图像将是单个数据点(,而不仅仅是对给定图像的像素进行聚类。一个好的起点可能是用于数字识别的 MNIST 数据集。
此外,k-means 是一种无监督学习算法,可能不会为 OCR 提供很好的结果。它创建的类可能会将类似的字母(如a
和o
(混合在一起,为用不同音节编写的同一字母创建多个类,并完全忽略其他字母。
您应该考虑使用标记训练数据的监督算法,例如 k 最近邻。这样,您将提前知道课程是什么,并在测试阶段取得更好的成功。