用于检查 IBAN 校验和的机器学习

我是机器学习的新手，我需要一些帮助和想法。我想检测 IBAN 编号是否有效，应该在不知道校验和算法的情况下对其进行检查。

我想用很多有效和无效的IBAN来训练AI。培训结束后，我想测试一个IBAN，系统应该告诉我它是否是一个有效的数字。

我有一个以下格式的CSV文件...

IBAN，有效 DE03683515573047232594，真实 DE89500502010000180802，真实 DE33100500000000484848，假 DE47701500000034343434，假 ...

我正在使用带有numpy和sklearn的Python 3.6。

#! python
import sys
import csv
import matplotlib.pyplot as plt
import pandas
import numpy
import seaborn
import sklearn
filename    = "iban.csv"
raw_data    = open(filename, "rt")
reader      = csv.reader(raw_data)
iban_list   = list(reader)
data        = []
i = 0
for val in  numpy.array(iban_list):
if i > 0:
data.append(val)
i += 1
from sklearn import datasets, linear_model
from sklearn.model_selection import train_test_split
# Train Data
# https://www.ritchieng.com/pandas-scikit-learn/
# https://github.com/datacamp/courses-kaggle-python-machine-learning/blob/master/chapter2.md
train = pandas.read_csv(filename)
train.head()
feature_cols = ['IBAN', 'Valid']
# here I need some help =)

问候罗尼

我认为这个问题的重点是建立一个好的特征向量。假设我们不知道 IBAN 号码是如何验证的，因此，我们不希望其中的一部分是校验和等。我将构建一个至少具有以下特征的特征向量：

前两个字符
角色 3-4
字符 5-8
字符 9-12
字符 9 结束
最后两个字符
所有数字的总和
也许：所有数字的总和模组不同的数字

然后取决于您拥有多少训练数据。准备好数据后，您将将其提供给分类器。我会尝试不同的分类器，如CNN和决策树。训练后，您尝试通过验证集优化超参数。
然后，您在测试数据上对其进行测试并计算准确性，f1-score...
看看这个特征的表现如何会很有趣，也许你可以添加其他特征来优化你的分类器。
然后你可以

相关内容

最新更新

热门标签：