|
HTMLParser.handle_starttag(tag, attrs)
该方法用来处理一个标记的开始。通常被派生类重载;基类的实例什么都不做。
tag 参数是 tag 的名字的小写化。 attrs 参数是一个 list ,由 (name, value) 组成,反映了 <> 里面的属性。 name 会被翻译成小写字母,在 value 中的引号也被移除了,字符实体引用也会被替换。例如,有个 tag<A HREF=”http://www.pythontab.com/”> ,那么使用该方法就该这么做: handle_starttag(’a’, [(’href’, ’http://www.pythontab.com/’)])
Changed in version 2.6: 来自 htmlentitydefs 的所有实体引用都被属性值替换。
HTMLParser.handle_startendtag(tag, attrs)
和 handle_starttag() 类似,用来处理 XHTML 风格的 空标签( <a .../> )。可能被子类重载, which require this particular lexical information; 默认的实现只是简单的调用 handle_starttag() 和 handle_endtag()
HTMLParser.handle_endtag(tag)
该方法用来处理元素结束标记。可以被派生类重载;基类什么也不做。 tag 参数是 tag 的 name 转化来的小写字母。
其实内部调用的就是 handle_starttag() 和 handle_endtag() |
|