域名拆分 tld

概念

URL

Universal Resource Locator ,统一资源定位符。

用处:用来标识互联网资源的唯一地址。

本质:提供了互联网上任一资源地址的通用表示方法。

protocol://host:port/path/file.name?parameter

红色部分合称为domain

如:http://baidu.com/index.html  ftp://example/index.pdf

https://www.baidu.com

TLD:顶级域——>com

SLD:二级域——>baidu

子域名:——>www

用Python的第三方包 tld,拆分域名信息。

from tld import get_tld, get_fld

url = 'http://www.baidu.com'

print(get_fld(url))
# baidu.com

s = get_tld("http://www.baidu.com", as_object=True)
print(s, s.domain, s.subdomain, s.fld)
print(s.parsed_url, s.parsed_url.scheme, s.parsed_url.netloc)

# com baidu www baidu.com
#
SplitResult(scheme='http', netloc='www.baidu.com', path='', query='', fragment='') http www.baidu.com

更多方法

原文地址:https://www.cnblogs.com/ldy-miss/p/10233304.html