V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
woniu127
V2EX  ›  Python

又写了一个域名爬虫

  •  
  •   woniu127 · Jan 4, 2017 · 4468 views
    This topic created in 3402 days ago, the information mentioned may be changed or developed.
    爬取的是 2m3m 网站上的域名数据,比较容易爬取,下一步打算爬取抢米网的。另外还写了一个域名检索的程序,可以进行基本的检索,如全字母,全数字,限制长度,数字+字母,包含某个字符以及字符+英文单词,并且加入了查询域名是否已注册的程序。
    github:https://github.com/gaokaigithub/2m3m
    7 replies    2017-01-05 18:17:32 +08:00
    Sanko
        1
    Sanko  
       Jan 4, 2017
    还以为我被盗号了
    woniu127
        2
    woniu127  
    OP
       Jan 5, 2017 via Android
    @Sanko 哈哈哈,这么巧
    hiboshi
        3
    hiboshi  
       Jan 5, 2017
    走的人家接口
    其实可以拿 whois 信息的
    woniu127
        4
    woniu127  
    OP
       Jan 5, 2017 via Android
    @hiboshi 嗯嗯,也写过直接用 whois 的,因为用万网的 api 简单,就直接用了
    Viking
        5
    Viking  
       Jan 5, 2017
    好像不错,研究研究
    jiuzhe
        6
    jiuzhe  
       Jan 5, 2017
    目的是啥啊? 我有写过一个小网站 miduobao.com ,删除域名在 http://www.miduobao.com/viewdomaindeletedates.php
    没理解兄台从 2m3m 抓啥内容,它自己也是从别的地方抓来的数据啊
    woniu127
        7
    woniu127  
    OP
       Jan 5, 2017
    @jiuzhe 抓数据主要用来自己分析,找自己想要的域名
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   936 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 21:37 · PVG 05:37 · LAX 14:37 · JFK 17:37
    ♥ Do have faith in what you're doing.