lxml中使用xpath方法获取html标签中的内容时经常会使用text()
1 2 |
|
这段代码是从百度首页html中解析hao123这段文字。
使用一下这个变量s,很普通吧~
1 2 3 4 |
|
但是如果想把这个变量使用pickle序列化
1 2 |
|
报错了~
1
|
|
为什么呢?
我们被s==’hao123’骗了,这个s并不是str类型,而是lxml.etree._ElementStrinResult类型,比str多了getparent、is_text等多个方法,pickle对这个类型不能识别,因此转换一下类型即可。
自己写个转换类型函数
1 2 |
|
以后需要使用text()的时候,改为调用这个函数了:
1 2 |
|
总结
在pickle时,请谨慎使用text()