这个概念是,在成功保存我的对象后,它应该更新数据库中的文本(带有钩子)。让我们称该字段为">succText"。我想访问的表是sys_file,但我在保存对象时只得到sys_file_reference id。所以我想我可以使用连接池来选择此文件引用的sys_file行,然后在">succText"字段中插入数据。
我试过这个:
public function processDatamap_preProcessFieldArray(array &$fieldArray, $table, $id, TYPO3CMSCoreDataHandlingDataHandler &$pObj) {
$queryBuilder = GeneralUtility::makeInstance(ConnectionPool::class)->getQueryBuilderForTable('sys_file_reference');
$findItemsId = $queryBuilder
->select('*')
->from('sys_file_reference')
->join(
'sys_file_reference',
'sys_file',
'reference',
$queryBuilder->expr()->eq('reference.uid', $queryBuilder->quoteIdentifier('uid_local'))
)
->where(
$queryBuilder->expr()->eq('uid_local', $queryBuilder->createNamedParameter($fieldArray['downloads'], PDO::PARAM_INT))
)
->execute();
}
但这给了我sys_file_reference id,而不是 id 和sys_file表的字段值。
至于更新,我还没有尝试过,因为我还没有弄清楚,如何获取需要更新的行。找到行后,我用一个子查询,我真的不知道。
processDatamap_preProcessFieldArray将重命名为发布。我这样做只是为了在后端获得结果。
提前感谢,
您可能希望在此处使用 FileRepository 类。
$fileRepository = GeneralUtility::makeInstance(TYPO3CMSCoreResourceFileRepository::class);
$fileObjects = $fileRepository->findByRelation('tablename', 'fieldname', $uid);
其中$uid是文件通过文件引用连接到的记录的 ID。
你将得到一个要处理的文件对象数组。
我通过删除第一个代码并添加一个文件存储库实例解决了我的问题。
$fileRepository = GeneralUtility::makeInstance(FileRepository::class);
$fileObjects = $fileRepository->findByRelation('targetTable', 'targetField', $uid);
非常重要!
如果要创建新元素,则 TYPO3 会分配一个临时UID变量,其名称类似于NEW45643476。为了从processDatamap_afterDatabaseOperations获取$uid,您需要在获取 fileRepository 的实例之前添加此代码。
if (GeneralUtility::isFirstPartOfStr($uid, 'NEW')) {
$uid = $pObj->substNEWwithIDs[$uid];
}
现在就文本而言,我从pdf中提取。首先,我必须获取文件的基本名称才能找到其存储位置和名称。由于我只有一个文件,所以我真的不需要 foreach 循环,我也可以使用 [0]。所以代码看起来像这样:
$fileID = $fileObjects[0]->getOriginalFile()->getProperties()['uid'];
$fullPath[] = [PathUtility::basename($fileObjects[0]->getOriginalFile()->getStorage()->getConfiguration()['basePath']), PathUtility::basename($fileObjects[0]->getOriginalFile()->getIdentifier())];
这,给我一个看起来像这样的数组:
array(1 item)
0 => array(2 items)
0 => 'fileadmin' (9 chars)
1 => 'MyPdf.pdf' (9 chars)
现在我需要将每个页面的文本保存在变量中。所以代码看起来像这样:
$getPdfText = '';
foreach ($fullPath as $file) {
$parser = new Parser();
$pdf = $parser->parseFile(PATH_site . $file[0] . '/' . $file[1]);
$pages = $pdf->getPages();
foreach ($pages as $page) {
$getPdfText .= $page->getText();
}
}
现在我有了我的文本,我想将其添加到数据库中,以便我可以在搜索操作中使用它。我现在使用连接池从sys_file获取文件。
$queryBuilder = GeneralUtility::makeInstance(ConnectionPool::class)->getQueryBuilderForTable('sys_file');
$queryBuilder
->update('sys_file')
->where(
$queryBuilder->expr()->eq('uid', $queryBuilder->createNamedParameter($fileID))
)
->set('pdf_text', $getPdfText)
->execute();
现在,每次我从扩展中选择PDF时,我都会将其文本保存在数据库中。
额外内容
如果您还想包含 PDFParser 并且您处于作曲家模式,请在您的 composer.json 上添加以下内容:
"smalot/pdfparser" : "*"
并在自动加载时:
"Smalot\PdfParser\" : "Packages/smalot/pdfparser/src/"
然后在:yourExtension/Classes/Hooks/DataHandler下.php添加命名空间:
use SmalotPdfParserParser;
现在,您可以使用getPages()
和getText()
功能。
文档
如果我错过了什么,请告诉我,我会添加它。