如何预测此 k 均值中的字符

我正在做手写字符识别执行后我得到了这样的输出

我

的目标是预测输出图像文件(如测试(的字符，我使用了这个 k 均值文件

任何人都可以帮助我预测输出图像的特征。这将帮助我提前在我的项目中继续进一步的步骤。

执行 OCR 需要相当大的现有字母训练集，以便对 k 均值进行操作。在此应用程序中使用 k 均值将涉及对图像本身进行聚类(单个图像将是单个数据点(，而不仅仅是对给定图像的像素进行聚类。一个好的起点可能是用于数字识别的 MNIST 数据集。

此外，k-means 是一种无监督学习算法，可能不会为 OCR 提供很好的结果。它创建的类可能会将类似的字母(如a和o(混合在一起，为用不同音节编写的同一字母创建多个类，并完全忽略其他字母。

您应该考虑使用标记训练数据的监督算法，例如 k 最近邻。这样，您将提前知道课程是什么，并在测试阶段取得更好的成功。

相关内容