Symfony2 DomCrawler和FB2书籍格式解析器

All!

How do I parse correctly described XML file with Symfony2 DomCrawler component?

I need to split all the sections and collect an internal tags (epigraph, p, poem etc.) with the current section together which belongs to this section only.

I've standard FB2 book XML format described below:

<?xml version="1.0" encoding="utf-8"?>
<FictionBook xmlns="http://www.gribuser.ru/xml/fictionbook/2.0" xmlns:l="http://www.w3.org/1999/xlink">
<description></description>
<body>
<section>
    <title><p><strong>Level 1, section 1</strong></p></title>
    <section>
        <title><p><strong>Level 2, section 2</strong></p></title>
        <section>
            <title><p><strong>Level 3, section 3</strong></p></title>
            <p>Level 3, section 3, paragraph 1</p>
            <poem>
                <stanza>
                    <v>bla-bla-bla 1</v>
                    <v>bla-bla-bla 2</v>
                    <v>bla-bla-bla 3</v>
                </stanza>
            </poem>
            <p>Level3, section 3, paragraph 2</p>
            <subtitle><strong>x x x</strong></subtitle>
        </section>
        <section>
            <title><p><strong>Level 3, section 4</strong></p></title>
            <p>Level 3, section 4, paragraph 1</p>
            <p>Level 3, section 4, paragraph 2</p>
            <subtitle><strong>x x x</strong></subtitle>
        </section>
        <section>
            <title><p><strong>Level 3, section 5</strong></p></title>
            <p>Level 3, section 5, paragraph 1</p>
            <p>Level 3, section 5, paragraph 2</p>
            <p>Level 3, section 5, paragraph 3</p>
            <empty-line/>
            <subtitle>This file was created</subtitle>
            <subtitle>with BookDesigner program</subtitle>
            <subtitle>bookdesigner@the-ebook.org</subtitle>
            <subtitle>22.04.2004</subtitle>
        </section>
    </section>
</section>
</body>
</FictionBook>

The code below do not work, so could somebody help me to solve this? Btw, title parsed correctly... but section's tags not...

private function loadBookSections(Crawler $crawler)
{
    $sections = $crawler->filter('section')->each(function(Crawler $node) {
        $c = $node->filter('section')->reduce(function(Crawler $node, $i) {
            return ($i == 0);
        });

        return array(
            'title' => $node->filter('title')->text(),
            'inner' => $c->html(),
        );
    });

    echo "*******************************************
";

    foreach($sections as $section ) {
        echo ">>> ".$section['title']."
";
        echo "!!! ".$section['inner']."
";
    }
}

And Thanks for help!

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dq1685513999 2013-11-20 15:12
关注
After four days... I've found the solution via XPath...

private function loadBookSections(Crawler $crawler) { $sections = $crawler->filter('section')->each(function(Crawler $node) { return array( 'title' => $node->filter('title')->text(), 'inner' => $node->filterXPath("//*[not(section)]")->html(), ); }); foreach($sections as $section) { echo "TITLE: ".$section['title']." "; echo "INNER: ".$section['inner']." "; } }
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Symfony2 DomCrawler和FB2书籍格式解析器 php symfony
2013-11-14 13:53

回答 2 已采纳 After four days... I've found the solution via XPath... private function loadBookSections(Crawler
如何使用IF symfony2 PHP比较控制器中的对象 php symfony
2016-11-12 10:32

回答 1 已采纳 at first I would change your back link to am usually link, not an form. Your mistake in the cond
Symfony2 DB2原则：无法创建数据库 php symfony
2016-04-12 12:09

回答 2 已采纳 The solution seems to be simple: just use "doctrine:schema:create" instead of "doctrine:database
Symfony2学习笔记之插件格式分析
2020-10-22 16:55

主要介绍了Symfony2的插件格式,详细分析了Symfony2的插件原理及创建与使用插件的相关技巧,需要的朋友可以参考下
Symfony2使用Select2和Ajax搜索数据库 ajax javascript php symfony
2016-09-25 16:30

回答 2 已采纳 Its up to you to write the queryBuilder in controller or in repository (Recommended) and call that
如何将变量从javascript传递给symfony2控制器 javascript jquery php symfony
2017-08-23 08:40

回答 1 已采纳 The problem here is that you refresh the page which means that you call the controller without any
无法使用SwiftMailer和Symfony 2发送电子邮件 php symfony
2016-02-26 13:36

回答 2 已采纳 For sending mail with Gmail you can use transport: gmail If you need more information: http://sym
为Symfony2和Redis正名，基于PHP的10亿请求/周网站打造
2021-03-01 22:17

如果你还在Symfony2和Redis使用中存在这样的错误观念——不能使用Redis作为主要存储；Symfony2的功能很多，以至于它的运行很慢，那么不妨看向Octivi的高请求网站打造。虽然没有底层细节，但详细展示基于两者应用的...
集成Symfony2和Redis php symfony
2016-02-01 12:40

回答 1 已采纳 Your Redis config looks OK. You are using Redis to cache Meatada (Doctrine collected about Entitie
Symfony 2 - 非捆绑库集成和位置 php symfony
2017-05-28 21:26

回答 1 已采纳 as mentioned by b.enoit.be create a service from the class. MyBundle/Service/MyServiceClass.php
使用symfony2控制器的外部库 php symfony
2017-03-14 09:53

回答 1 已采纳 usekeyword must appear before require_once (http://php.net/manual/en/language.namespaces.importing
HenterGEO：基于Symfony2和MongoDB的位置查询演示
2021-02-04 17:14

基于Symfony2和MongoDB的地理位置查询演示安装 $ git clone https://github.com/henter/HenterGEO.git $ cd HenterGEO/ $ composer update $ php app/console doctrine:mongodb:schema:update $ php app/console ...
未找到Symfony 2和PhpUnit类 php symfony
2016-10-23 01:24

回答 1 已采纳 The problem is in here $user1 = new User(); If your User class located in RepositoryBundle\Entity,
Symfony2开发之控制器用法实例分析
2020-10-22 20:55

主要介绍了Symfony2开发之控制器用法,结合实例形式分析了Symfony2控制器的简单使用技巧,需要的朋友可以参考下
高性能PHP框架Symfony2经典入门教程
2020-10-25 16:38

主要介绍了高性能PHP框架Symfony2的入门教程，对于学习Symfony2的朋友有很好的学习借鉴价值,需要的朋友可以参考下
Symfony2学习笔记之控制器用法详解
2020-10-22 16:54

主要介绍了Symfony2控制器用法,详细分析了Symfony控制器的功能,实现技巧与相关技术细节,需要的朋友可以参考下
RedisBundle:Symfony2在predis上捆绑
2021-04-10 02:37

symfony2捆绑在predis之上参见特征语义配置 sf2事件调度程序集成带有M6Web\Bundle\RedisBundle\Redis\RedisSessionHandler存储的会话处理程序： M6Web\Bundle\RedisBundle\Redis\RedisSessionHandler 狂饮缓存...
geoip2:Maxmind GeoIP2 API的Symfony捆绑包
2021-05-08 19:32

Maxmind GeoIP2 API的Symfony捆绑包捆绑用于Symfony中的。安装使用简单，运行： composer req gpslab/geoip2 配置要配置自动更新数据库，您需要生成个人许可证密钥。生成许可证密钥的步骤（无需购买）登录...
panther：针对PHP和Symfony的浏览器测试和Web爬网库
2021-02-04 17:52

Panther非常易于使用，因为它实现了Symfony流行的和 API，并且包含测试应用程序所需的所有功能。如果您曾经创建那就听起来很熟悉：因为API完全相同！请记住，Panther可以在每个PHP项目中使用，因为它是一个独立的...
没有解决我的问题, 去提问

悬赏问题

¥30 深度学习，前后端连接
¥15 孟德尔随机化结果不一致
¥15 apm2.8飞控罗盘bad health，加速度计校准失败
¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
¥15 谁有desed数据集呀
¥20 手写数字识别运行c仿真时，程序报错错误代码sim211-100
¥15 关于#hadoop#的问题
¥15 (标签-Python|关键词-socket)
¥15 keil里为什么main.c定义的函数在it.c调用不了
¥50 切换TabTip键盘的输入法

Symfony2 DomCrawler和FB2书籍格式解析器

2条回答 默认 最新

悬赏问题

2条回答默认最新