欧拉 22 项目 - 得到错误的数字



我是Python和机器学习的新手。我正在尝试解决欧拉#22项目,该项目需要从每个名称中获取字母值并与其字母顺序位置相乘。 正确答案是871198282,但我不断得到823763619。

我已经检查了包含名称的.txt文件。它们看起来不错,并且导入了名称文件,没有任何问题。我已经一步一步地检查了代码。当我单独调用给定名称中的任何名称时,我的函数会给我正确的数字,例如,COLIN,它给了我 49714。 然后我认为我的主体是错误的,我将所有数字组合在一起,但对我来说它看起来不错。

你能给我一些线索吗,我必须仔细看看? 此外,我知道我的代码看起来像菜鸟,我可以为我的代码升级到下一个级别提出任何建议吗?

提前非常感谢你。

# Using names.txt (right click and 'Save Link/Target As...'), a 46K text file containing over five-thousand first names, 
# begin by sorting it into alphabetical order. Then working out the alphabetical value for each name, multiply this value 
# by its alphabetical position in the list to obtain a name score.
# For example, when the list is sorted into alphabetical order, COLIN, which is worth 3 + 15 + 12 + 9 + 14 = 53, 
# is the 938th name in the list. So, COLIN would obtain a score of 938 × 53 = 49714.
# What is the total of all the name scores in the file?
import os
import pandas as pd
import numpy as np
total_counts = []
path ='C:\python_practice_data'
file_path = os.path.join(path, 'name.txt')
name_list = pd.read_csv(file_path)
name_list=list(name_list)
name_list.sort()
def counts(name):
_alphabet = {
'A': 1,
'B': 2,
'C': 3,
'D': 4,
'E': 5,
'F': 6,
'G': 7,
'H': 8,
'I': 9,
'J': 10,
'K': 11,
'L': 12,
'M': 13,
'N': 14,
'O': 15,
'P': 16,
'Q': 17,
'R': 18,
'S': 19,
'T': 20,
'U': 21,
'V': 22,
'W': 23,
'X': 24,
'Y': 25,
'Z': 26              
}
total = 0
cha_name=[]
for i in range(len(name_list)): 
if name in name_list[i]:
cha_name = list(name)
print(cha_name)
for j in range(len(cha_name)):
if cha_name[j] in _alphabet:
total += _alphabet[cha_name[j]]
#print(total)
else:
break
return total
#Count the name in alphabericl order
def numbering(name):
for i in range(len(name_list)):
if name in name_list[i]:
#print(i+1)
break
else: 
continue
return i+1    
#Main
for i in range(len(name_list)):
name = name_list[i]
total_numbers = numbering(name)*counts(name)
total_counts.append(total_numbers)
print(sum(total_counts))

您的代码有点长,需要解压缩的内容太多,无法涵盖此处的所有内容,但这里有一些注释。

关于您的counts功能:

  • 看起来目标是将名称的字符值总和相加,A=1,B=2等;因此"Colin"(作为"COLIN"(将是53。
  • 你引用了name_list,但除了检查name是否在列表中之外,你实际上并没有使用它,但这对函数的作用无关紧要。
  • 您有一个详细的字母枚举,为每个字母分配一个数字,但有一些标准函数可以为您执行此操作。

count函数的更短版本:

def count(name):
return sum([ord(ch)-64 for ch in name.upper()])

这将计算name中所有字符的字符值列表的总和。它调用name.upper()以确保名称中的所有字母都转换为大写。它使用ord(ch)来获取每个字符的序号值 -ord('A')是 65,ord('B')是 66,依此类推,所以它减去 64 得到 A=1、B=2 等。

代码的其余部分应该: - 读取输入文件(据说具有唯一的名称,没有重复项( - 按字母顺序排序 - 使用结果列表计算列表上每个名称在列表中的位置乘以其字符值,如使用count计算 - 所有名称的总和

关于您的numbering功能:

  • 它实际上什么都不做,除了以非常迂回的方式返回名称总数
  • 我认为您打算做的是计算名称在名称列表中的位置

同样,这只需要一行:

number = name_list.index(name)

每个列表都有一个方法,它只告诉您列表中值的索引是什么。因此,如果'Colin'在列表中是数字 938,name_list.index('COLIN')将返回 938。

最后,您使用pandas来读取文件,但由于您不使用DataFrame或任何其他特定于pandas的数据结构,并且只希望列表中的所有内容,因此您可以轻松地使用内置的Python库 - 更重要的是,因为它不是真正的.csv,而只是一个带有名称的平面文本文件。

然后整个程序变成这样:

def count(name):
return sum([ord(ch)-64 for ch in name.upper()])

with open('C:\python_practice_data\name.txt', 'r') as f:
name_list = sorted(f.read().split())
result = sum([count(name) * (name_list.index(name) + 1) for name in name_list])
print(result)

注意:将 1 添加到name_list.index(name)因为index从 0 开始,但名字可能应该在位置 1,而不是 0。

或者,如果您不喜欢所谓的列表推导的简写:

def count(name):
result = 0
for ch in name.upper():
result += ord(ch)-64
return result

with open('C:\python_practice_data\name.txt', 'r') as f:
name_list = sorted(f.read().split())
result = 0
for name in name_list:
result += count(name) * (name_list.index(name) + 1)
print(result)

这里没有使用任何真正高级的东西,不需要外部库。

最新更新