我正在尝试创建一个python脚本,该脚本查询我的帮助台票证,解析HTML,并将解析的信息输出到XML或JSON文件中。
我已经到了脚本输出字符串的地步,这里有一个字符串的例子:
EMPLOYEE INFORMATION
Name: EmployeeName
Employee Type: Salaried/Hourly
Department: DepartmentName
Department Number: IntegerValue
Employee Title: EmployeeTitle
Supervisor Name: SupervisorName
FACILITIES INFORMATION
Location: OfficeLocation
SECURITY INFORMATION
Access card required?: Boolean
Copy access card from: CopyFromUser
Elevated access justification: Boolean
我需要做什么才能将这个字符串中的信息填充到变量中,例如
EmployeeName = string
DepartmentName = string
AccessCardRequired = boolean
DepartmentNumber = int
根据要解析的字符串的结构,有不同的库可以帮助您实现这一点。例如,为html解析简单文本的configparser或beautiuloup。
如果字符串的格式如上所述:
- 每行一个变量
- variable_name:值
您可以直接使用Python自带的configparser。https://docs.python.org/3/library/configparser.html
如果文本是html格式的,则可以检查beautuloup。https://www.crummy.com/software/BeautifulSoup/bs4/doc/
使用+字符将变量集中为字符串。
示例:
variable = "Text 2"
print("Text 1 " + variable + " Text 3")
输出:
Text 1 Text 2 Text 3
如果变量类型是整数,则需要在连接之前将其转换为字符串。要进行转换,我们将使用str((函数。
variable = 2
# insert a variable into string using concatenation
print("One " + str(variable) + " Three")
输出:
One 2 Three