理解Zend 框架(4): 用Zend_HTTP_Client 获取无提要的内容

413阅读 0评论2008-04-14 剑心通明
分类:

并非所有的站点都包含提要,但是跟进某个地方的所有改动仍然是很有用的。本文将介绍如何使用 Zend_HTTP_Client 模块创建代理,从而将数据提取到提要阅读器界面中。在本文中,您将学到:

如何使用 Zend_HTTP_Client 模块加载网站数据。
如何保存提要条目的全文以及那些不支持提要的网页的全文。
如何在提要阅读器界面中阅读已保存提要条目的全文。
在本文的末尾,将完成提要阅读器应用程序的框架。首先,修改纲要,其次,更新代码以支持新的纲要,然后添加将提要条目和网页保存到数据库中的功能。最后,使用 Zend_HTTP_Client 模块支持用户有选择地将条目保存到数据库中,并在已更新的在线提要阅读器中查看它们。

更新数据库纲要

为了将提要条目保存到提要阅读器界面中,首先我们需要更新数据库纲要。在 控制台中键入清单 1 中的SQL 语句。


清单 1. 更改数据库纲要

drop table feeds;

create table feeds
(feedname varchar(256), link varchar(512), varchar(5));

insert into feeds values
('Fox Sports',
 '',
 'true'),
('Google News',
 '',
 'true'),
('Yahoo News',
 '',
 'true'),
('phpbb',
 '',
 'false'),
('MySQL Forums :: PHP',
 '',
 'false'),
('SitePoint Forums :: PHP',
 '',
 'false');

drop table savedentries;

create table savedentries
(username varchar(20), feedname varchar(256), channelname varchar(256),
 link varchar(512), entrysaved varchar(5), entrydata varchar(307200));
 


您能看到 feeds 表添加了一个新的字段:rss。这个字段用于辨别该提要是 RSS 提要还是不支持提要的网页。订阅列表中添加了另外三个不同 论坛的提要。请注意,对于第 3 部分中的提要,这个新字段值为 true,而三条新提要的值则为 false,这说明它们是网页,而非 RSS 提要。savedentries 表有两个新的字段:entrysaved 和 entrydata。entrysaved 字段说明 entrydata 字段中的数据是有效数据。entrydata 字段保存了该文章的全文。新的可订阅网页如图 1 所示。

现在需要回到第 3 部分的代码中做一些更改。

更新 IndexController 类

稍后我们将对 viewFeeds 视图进行更新,这需要当前用户所订阅的非 RSS 提要的列表,该列表列出了已订阅的提要和网页。在 IndexController 类中更改 indexAction 方法,如下所示。


清单 2. IndexController 类中的 indexAction 方法

    public function indexAction()
    {
...
            $select->where('feeds.feedname=subscribedfeeds.feedname');
            $select->where('feeds.rss=?', 'true');
            $rssResults = $db->fetchAll($select);

            $select = $db->select();
            $select->from('subscribedfeeds, feeds', '*');
            $select->where('subscribedfeeds.Username = ?', $username);
            $select->where('feeds.feedname=subscribedfeeds.feedname');
            $select->where('feeds.rss=?', 'false');
            $webResults = $db->fetchAll($select);

            $view = ::registry('view');
            $view->username = $username;
            $view->rssFeeds = $rssResults;
            $view->webFeeds = $webResults;
            echo $view->render('viewFeeds.php');
        }
    }
 


这里包含了两个结果列表:一个包含用户订阅的 RSS 提要,而另一个包含当前用户订阅的网页。这些提要随后被传送到 viewFeeds 视图,并被显示出来。

更新 saveEntryAction 方法

我们需要更新那些可以用来将条目保存到数据库中的链接,这样我们就可以更新这两个新字段了。更改 FeedController 类中的 saveEntryAction 方法,如下所示。


清单 3. FeedController 类中的 saveEntryAction 方法

    public function saveEntryAction()
    {
        $filterSession = Zend::registry('fSession');
        $username = $filterSession->getRaw('username');

        $filterPost = Zend::registry('fPost');
        $feedTitle = $filterPost->getRaw('feedTitle');
        $channelTitle = $filterPost->getRaw('title');
        $channelLink = $filterPost->getRaw('link');
        $type = $filterPost->getRaw('type');
        $saveFullText = $filterPost->getRaw('saveFullText');
...
        $db = Zend::registry('db');
        $row = array(
                     'Username' => $username,
                     'feedname' => $feedTitle,
                     'channelname' => $channelTitle,
                     'link' => $channelLink,
                     'entrysaved' => $saveFullText ? 'true' : 'false',
                     'entrydata' => $fullText
                     );
       
        $table = 'savedentries';
        $rowsAffected = $db->insert($table, $row);

        if($type == 'webPage')
            $this->_redirect("/");
        Else
            $this->_redirect("/feed/viewChannel?title=$feedTitle");
    }
 


清单 3 中第一段黑体代码将数据从 POST 数组(而不是 GET 数组)中提取出来,因为这就是请求保存提要的方式(不想在 URL 中发送文章的全文)。请注意 savedentries 表中的两个新字段 type 和 saveFullText 是如何被检索的。已经检索的数据被保存为 savedentries 表中的一个新行,并且,如果保存了一个网页,那么用户将被转回到主页;否则用户将被转回到他正在查看的频道。

更新 deleteEntryAction 方法

我们更新了从数据库中删除条目的代码。更改 FeedController 类中的 deleteEntryAction 方法,如下所示。


清单 4. FeedController 类中的 deleteEntryAction 方法

    public function deleteEntryAction()
    {
        $filterSession = Zend::registry('fSession');
        $username = $filterSession->getRaw('username');

        $filterPost = Zend::registry('fPost');
        $feedTitle = $filterPost->getRaw('feedTitle');
        $channelTitle = $filterPost->getRaw('channelTitle');
        $type = $filterPost->getRaw('type');

        $db = Zend::registry('db');
        $table = 'savedentries';
        $where = "username='$username' and feedname='$feedTitle'";
        if($type == 'rssFeed')
            $where = "$where and channelname='$channelTitle'";
        $rowsAffected = $db->delete($table, $where);
       
        $this->_redirect('/feed/viewSavedEntries/');
    }
 


第一段黑体代码从 POST 数组中获取数据。同样,也获得了条目中的 type 字段。我们可以看到新的 where 子句根据 RSS 提要搜寻匹配的 channelname,因为网页不包含 channelname。

将数据库变更和新功能添加到视图中

既然控制器与将传送给视图的新数据是一起更新的,那么我们需要更新该视图来捕获此数据,并适当地将其展示给用户。

viewFeeds 视图

这个视图向已登录用户展示了已订阅的提要和 Web 站点。我们需要更改此视图,以展示用户当前订阅的非 RSS Web 站点。所以,让我们来更改 viewFeeds.php 文件,如下所示。


清单 5. viewFeeds 视图

...
         echo "".
              "$feedTitle

";
     }
     ?>
 


 


   
     
     
     
   
       foreach($this->webFeeds as $row){
         $feedTitle = $row['feedname'];
         $link = $row['link'];
         echo "";
         echo "              "value='$feedTitle'/>";
         echo "";
         echo "";
         echo "";
         echo "";
         echo "";
     }
     ?>
 
Subscribed Web Pages:     
       
Save Entry to Database
       
Save Full Text
 href='$link'>$feedTitle
 value='save'/>              "type='checkbox'/>


...
 


清单 5 中的表显示了已订阅的网页。当我们在每个循环遍历每个条目时,会嵌入了一些包含页面标题、链接和类型(webPage,与 rssFeed 相对)的隐藏输入项,并且显示了一个到实际网页的链接。在这个网页中,包含了一个带复选框的用来保存条目的表单,可通过该复选框支持用户保存页面的全文。参见图 2。

试着保存 “MySQL Forums :: PHP” 页面条目及其全文,我们稍后就会看到它的样子。

viewChannel 视图

更新 viewChannel 视图,以包含如清单 5 中所示的用于保存条目的表单。修改 viewChannel 视图,如下所示。


清单 6. 修改后的 viewChannel 视图

...
     Save entry to database
              
      Save Full Text
   
       $feedTitle = $this->title;
     foreach ($this->rssFeed as $item) {
         $entryTitle = $item->title();
         $link = $item->link();
         echo "

";
         echo "              "value='$feedTitle'/>";
         echo "              "value='$entryTitle'/>";
         echo "";
         echo "";
         echo "$entryTitle
";
         echo "";
         echo "              "type='checkbox'/>
";
     }
?>
 
...
 


可以看到上面清单与清单 5 有相似之处,但要注意的是,该隐藏值类型被设置为 rssFeed,而不是 webPage。查看已更新示例的浏览器输出,如图 3 所示。

viewSavedEntries 视图

有了与(或不同)全文一起保存的条目,还需要相应地修改 viewSavedEntries 视图。为此,请参照下列清单。


清单 7. viewSavedEntries 视图

...
      Delete Channel Entry
      
       

      View Saved Full Text
   
       foreach ($this->entries as $row) {
         $link = $row['link'];
         $channelTitle = $row['channelname'];
         $feedTitle = $row['feedname'];
         $entrysaved = '';
         if($row['entrysaved'] == 'true')
             $entrysaved = 'Full Text';
         $title = "$feedTitle";
         if($row['channelname'] != ''){
             $title = "$title > $channelTitle";
             $type = 'rssFeed';
         } else {
             $type = 'webPage';
         }
         echo "

";
         echo "              "value='$feedTitle'/>";
         echo "              "value='$channelTitle'/>";
         echo "";
         echo "";
         echo " href='$link'>$title";
         echo " value='delete'/>";
         echo " href='/feed/fullText?feedTitle=$feedTitle&".
              "channelTitle=$channelTitle'>".
              "$entrysaved";
     }
?>
 
...
将 delete 链接修改成一个带有 Delete 按钮的表单。在 foreach 循环中,查看条目是否保存了全文,如果是,则将 entrysaved 变量设置为 "Full Text "。否则,该变量仍为空。然后设置条目标题及其类型。在表单中,我们嵌入了四个隐藏的输入项:条目的 feedname、channelname(此值在 webPage 类型时为空)、完整的 link 和 type。随后我们显示了到实际网页的链接、删除条目按钮以及到已保存网页的全文的链接(如果保存了全文)。请注意,该行为指向 /feed/fullText,所以在下一部分中,将在 FeedController 中定义一个新的 fullTextAction 方法。可以在图 4 中看到修改后的 viewSavedEntries 视图。

保存提要条目

有了这个代码,用户就能够选择是否要保存提要条目和网页的全文,现在惟一余下的事情是用于抓取网页的代码(使用 Zend_HTTP_Client )。在这一小节中,我们定义了该代码和 fullText 行为,该行为用于向用户展示已保存条目的全文。

使用 Zend_HTTP_Client:saveEntryAction

是时候在 FeedController 类中完成 saveEntryAction 方法了,此方法所对应的行为是通过选中复选框保存条目的全文来完成的。修改 saveEntryAction 方法,如下所示。

清单 8. FeedController 类中的 saveEntryAction 方法

    public function saveEntryAction()
    {
        $filterSession = Zend::registry('fSession');
        $username = $filterSession->getRaw('username');
...
        if($saveFullText){
            $http = new Zend_Http_Client($channelLink);
            $response = $http->get();
            if ($response->isSuccessful())
                $fullText = $response->getBody();
            else{
                echo 'Error occurred, full text not saved, '.
                     'please reload.';
                return;
            }
        }

        $db = Zend::registry('db');
...
    }
 

如果复选框指出要保存条目,则使用 Zend_Http_Client 类抓取它,如上所示。将条目的全文保存到 fullText 变量中,随后,该变量在此方法中把全文保存到数据库条目中(参见 清单 3)。如果检索失败,则将一个错误消息显示给用户,用户可通过重新加载页面来再次尝试。

查看已保存条目的全文

定义 fullTextAction 方法,用户就能查看已保存条目的全文了。定义 FeedController 类中的 fullTextAction 方法,如下所示。

清单 9. FeedController 类中的 fullTextAction 方法

    public function fullTextAction()
    {
        $filterSession = Zend::registry('fSession');
        $username = $filterSession->getRaw('username');
       
        $filterGet = Zend::registry('fGet');
        $feedTitle = $filterGet->getRaw('feedTitle');
        $channelTitle = $filterGet->getRaw('channelTitle');

        $db = Zend::registry('db');
        $select = $db->select();
        $select->from('savedentries', '*');
        $select->where("username=?", $username);
        $select->where("feedname=?", $feedTitle);
        if($channelTitle)
            $select->where("channelname=?", $channelTitle);
        $sql = $select->__toString();
        $fullText = $db->fetchAll($sql);

        echo $fullText[0]['entrydata'];
    }
 

从 Session 及 Get 数组中获取 username、feedname 和 channelname。随后搜索 savedentries 表来获得匹配条目,然后获取匹配条目的全文并显示给用户。已保存的 “MySQL Forums :: PHP” 页面条目的全文如图 5 所示。

结束语

这样就完成了提要阅读器的创建!使用 Zend_HTTP_Client 从抓取网页,并将它们保存到您的提要阅读器中。您的在线提要阅读器同样支持 RSS 提要和网页。

本系列余下的部分包含对如何为 Chomp 应用程序增值的介绍。第 5 部分将介绍用户如何使用 Zend_PDF 模块为已保存的文章、图形和搜索结果创建一个定制的 PDF。第 6 部分中,将介绍如何使用 Zend_Mail 模块提醒用户有新的文章发布。第 7 部分将探讨如何搜索已保存内容并返回排列好的结果。第 8 部分中,我们将创建自己的混合模块,以添加 Amazon、Flickr 和 Yahoo! 中的信息。而在第 9 部分中,我们将使用 JavaScript 符号为网站添加 交互。


上一篇:10个网络规划PEAR类 来简化PHP编码
下一篇:ajax的最大缺点是什么?对搜索引擎的支持较弱