python3:如何删除Mediawiki模板的两个参数之间的数据



以下是来自Wikisource页面的数据-

{{:MediaWiki:Proofreadpage_index_template
|Type=book
|Title=மணி பல்லவம் 1
|Language=ta
|Author=நா. பார்த்தசாரதி
|Translator=
|Illustrator=
|Editor=
|Volumes=5
|School=
|Publisher=தமிழ்ப் புத்தகாலயம்
|Address=சென்னை
|Year=ஏழாம் பதிப்பு 2000
|Source=pdf
|Image=1
|Number of pages=295
|File size=19.88
|Category=
|Progress=C
|Pages=<pagelist 
1=நூலட்டை
2= உரிமம்
4=பதிப்பு
|Remarks=மேம்படுத்திய உள்ளடக்கத்தரவு
1. இந்திர விழா 12
2. சக்கரவாளக் கோட்டம் 22
3. கதக்கண்ணன் வஞ்சினம் 26
|Width=
|Css=
|Header=
|Footer=
|Key=
|ISBN=
|OCLC=
|LCCN=
|BNF_ARK=
|ARC=
}}

我想删除两个参数之间的一些特定数据,即从|备注=

|Width=我的测试代码-

#-*- coding: utf-8 -*-
import random, csv, time, subprocess, re, pywikibot
wikiPage1 = 'அட்டவணை:மணி பல்லவம் 1.pdf'
site = pywikibot.Site('ta', 'wikisource')
page1 = pywikibot.Page(site, wikiPage1)
res1 =  re.sub(r'|Remarks= *.*(?s)', '|Remarks=' , page1.text)
print(res1)

注释是有用的。当我单击时,有用的注释将被删除。为什么?无论如何,我的记录代码如下所示-根据需要,wiki页面的结果是肯定的。它将帮助2000多本书的创作。非常感谢,兄弟。对不起,我忘了你的名字,对不起。

#-*- coding: utf-8 -*-
import random, csv, time, subprocess, re, pywikibot

அட்டவணைப்பெயர் = 'அட்டவணை:மணி பல்லவம் 1.pdf'
site = pywikibot.Site('ta', 'wikisource')
page1 = pywikibot.Page(site, அட்டவணைப்பெயர்)

with open('0trans-தற்போதுள்ளநடுப்பகுதிவார்ப்புருஇப்ப26-கோப்பு.csv') as இடுகோப்பு3:
இடுகோப்புத்தரவு3 = இடுகோப்பு3.read()
#print(இடுகோப்புத்தரவு3)

#res1 =  re.sub(r'|Remarks= *.*(?s)', '|Remarks=' , page1.text)
page1.text = re.sub(r'(?<=|Remarks=)[sS]*?(?=|Width=)', 'n' + இடுகோப்புத்தரவு3 + 'n', page1.text)

print(page1.text)

page1.save(summary='+ உள்ளடக்கத்தரவில் வார்ப்புருக்கள் இடப்பட்டன') 

相关内容

  • 没有找到相关文章

最新更新