网页长截图

2020-04-13 2026-01-06

tech

5 minutes read (About 734 words)

网页长截图

雄文十万，也挡不住管理方的删帖封号，本文就来说一下怎么通过技术的方式来保存网页内容

python, splider

Python效率提升技巧

2019-12-19 2026-01-06

tech

14 minutes read (About 2038 words)

Python 效率提升技巧

副标题：超三成的python 初学者，倒在了这三个坑内

坊间流传着一句经典：“人生苦短，我用Python！”

python目前斩获的头衔有：挤掉java成为编程语言排行第二、增量最快、AI时代头牌语言，甚至已经入选北京山东等地的中小学教材，因为其简单易用，适用广泛，已经成为很多初学编程人的首选语言。

但由于Python的某些特有的历史原因，例如版本兼容问题等，导致在学习的过程中，总会遇到几个大坑，导致刚刚萌芽的学习热情就被无情浇灭。本篇主要讲解初学python过程中最常遇到的3个大坑：

版本兼容问题
依赖包无法下载安装问题
工程依赖环境问题

学习这几点，初学者不再倒在入门的门槛上，轻松入门；已入门的，可以帮您提高python开发使用和效率

python

python & bs4 基础

2016-09-19 2026-01-06

tech

7 minutes read (About 1000 words)

python & bs4

如果基于正则表达式来爬取网页，真的是太麻烦，而且正则要学得好，还真不容易。通过 bs4 select 或者 find 返回soup对象，可以很方便地提取出HTML或XML标签中的内容，简直不能更方便

举例：

req = urllib2.Request(target_url, headers = _headers)
myPage = urllib2.urlopen(req).read().decode(self.encoding)
soup = BeautifulSoup(myPage,'lxml')

dom_tag_a = soup.select('div[class*="right_wrap"] > div[class*="content"] > div[class*="phref"] > a')

python, splider

Logan Shen

价值 = 技术 * （10*影响力)

Changsha, China

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

网页长截图

网页长截图

Python效率提升技巧

Python 效率提升技巧

python & bs4 基础

python & bs4

Tag Cloud

Archives

Recent

Categories

Recent

Categories

Your browser is out-of-date!