CentOS 6系统Phantomjs访问HTTPS网站内容为空的问题

发表时间:2020-06-06 11:26 | 分类:Python | 浏览:1,723 次

随着时间的推移,centos 6的系统用的人也来也少,支持的越来越少。和当年的windows xp系统一样,很多软件已经无法打开。今天查看日志就发现一个尴尬的事情,在centos 6下有一个用python+selenium+phantomjs写的脚本程序获取到的网站内容为空。使用page_source查看网页源码,发现内容为空,类似如下:

<html><head></head><body></body></html>

使用curl直接打开网址正常,http网站也正常。

那么很可能就是phantomjs在打开https站点的时候ssl协议不支持,类似我们打开https网站弹出的警告。而且phantomjs现在也已经停止开发和维护,不能更新版本。

最后尝试给phantomjs添加忽略ssl警告和允许任何协议的参数:“--ignore-ssl-errors=true”,“--ssl-protocol=any”。

python代码类似如下:

微信截图_20200606112206

再次运行,一切又回归到了正常。

最后感叹,老系统还是应该争取早点换掉。现在的程序运行一直正常,但什么都不变几年后可能就会出现各种问题。IT技术一直在进步,只有不断跟上节奏才不会被淘汰。

参考:

https://stackoverflow.com/questions/39638830/how-do-i-get-selenium-webdriver-to-ignore-ssl-errors-in-firefox-and-phantomjs

https://blog.csdn.net/liwei128/article/details/79744123

本文标签:

本文链接:https://www.sijitao.net/3263.html

欢迎您在本博客中留下评论,如需转载原创文章请注明出处,谢谢!

现在只有1个回复
Comment (1)
Trackbacks (0)
  1. 百度seo优化  ( 2020.06.8 14:04 ) : #-9

    centos 不是主流吧,操作麻烦

  1. 还没有Trackbacks
一键脚本 博客历程 留言联系 文章归档 网站地图 谷歌地图
Copyright © 2010-2024 章郎虫博客 All Rights Reserved.