博客
关于我
python3----读取本机谷歌浏览器的访问的URL历史记录信息
阅读量:568 次
发布时间:2019-03-09

本文共 3323 字,大约阅读时间需要 11 分钟。

好的!以下是优化后的文章内容:

如何读取并分析谷歌浏览器的访问历史记录(附Python脚本)

你是否曾经想要了解自己浏览器的访问历史记录?可能你对谷歌浏览器的历史记录管理感兴趣,或者想统计自己浏览的网站访问频率?不管是出于哪种原因,通过Python脚本读取和分析浏览器历史记录确实是个不错的选择。本文将详细介绍如何操作,包括脚本代码和实际运行结果。

1. 获取谷歌浏览器的历史记录

谷歌浏览器的历史记录文件位于以下路径:

C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default

进入该目录,即可看到与浏览器相关的各种文件,其中包含详细的历史记录数据。

2. 使用Python读取浏览器历史记录

要读取和解析浏览器的历史记录,需要使用对应的数据库文件。以下是完整的Python3脚本:

# -*- coding: utf-8 -*-"""Created on Fri Jun 22 20:00:02 2018@author: Administrator"""import osimport sqlite3import operatorfrom collections import OrderedDictif __name__ == '__main__':    # 定义数据库路径,注意将上述路径替换为实际路径    data_path = r'C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default'    history_db = os.path.join(data_path, 'history1')        # 连接数据库    conn = sqlite3.connect(history_db)    cursor = conn.cursor()        # 查询所有记录    cursor.execute('SELECT * FROM urls;')        # 获取所有结果    results = cursor.fetchall()        # 显示结果    for d in results:        print(f"ID: {d[0]} \t"             f"URL: {d[1]} \t"             f"Title: {d[2]} \t"             f"visit_count: {d[3]} \t"             f"typed_count: {d[4]} \t"             f"last_visit_time: {d[5]} \t"             f"hiddlen: {d[6]} \t")        conn.close()

3. 运行结果解析

运行上述脚本后,输出将包括所有访问记录的详细信息,包括:

  • 访问ID:记录的唯一标识符
  • 访问URL:访问的具体网页地址
  • 访问标题:网页的标题(如果有)
  • 访问次数:网页被访问的总次数
  • 输入次数:用户对网页的输入次数
  • 最后访问时间:网页最后一次被访问的时间戳
  • 隐藏状态:记录是否被标记为“隐藏”

以下是示例输出(具体结果因浏览器而异):

ID: 1   URL: http://baojia.3hk.cn/301   Title: baojia.3hk.cn    visit_count: 0  typed_count: 0  last_visit_time: 0      hidden: 0  ID: 2   URL: http://blog.csdn.net/SKI_12/article/category/6689258   Title: 提权 - 闲云~ - CSDN博客        visit_count: 0  typed_count: 0  last_visit_time: 0      hidden: 0  ...

4. 统计不同网站的访问频率

如果你想了解哪些网站被频繁访问,可以参考以下脚本:

# -*- coding: utf-8 -*-"""Created on Fri Jun 22 20:00:02 2018@author: Administrator"""import osimport sqlite3import operatorfrom collections import OrderedDictdef parse_url(url):    try:        # 解析URL,提取主域名        parsed_url = url.split('//')[-1].split('/', 1)[0].replace('www.', '')        return parsed_url    except (IndexError, AttributeError):        print('URL格式错误!')if __name__ == '__main__':    # 定义数据库路径    data_path = r'C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default'    history_db = os.path.join(data_path, 'history1')        # 连接数据库    conn = sqlite3.connect(history_db)    cursor = conn.cursor()        # 查询所有记录    cursor.execute('SELECT urls.url, urls.visit_count FROM urls, visits WHERE urls.id=visits.url;')        # 获取所有结果    results = cursor.fetchall()        # 初始化统计字典    sites_count = {}        # 遍历结果并统计    for url, count in results:        url_domain = parse_url(url)        if url_domain in sites_count:            sites_count[url_domain] += 1        else:            sites_count[url_domain] = 1        # 定义排序方式    sorted_sites = sorted(sites_count.items(), key=lambda x: x[1], reverse=True)        # 输出结果    print("网站访问频率统计(前20名):")    for site, count in sorted_sites:        print(f"Domain: {site}, Visit Count: {count}")

5. 运行结果示例

运行上述脚本后,输出将包括如下内容:

Domain: sogou.com, Visit Count: 33  Domain: blog.csdn.net, Visit Count: 17  Domain: hao123.com, Visit Count: 14  Domain: btmayis.com, Visit Count: 10  Domain: v.qq.com, Visit Count: 10  Domain: iqiyi.com, Visit Count: 9  ...

通过上述方法,你可以轻松读取并分析谷歌浏览器的访问历史记录,并统计不同网站的访问频率。希望这篇文章能为你提供有价值的参考!

你可能感兴趣的文章
MSSQL数据库查询优化(一)
查看>>
MSSQL数据库迁移到Oracle(二)
查看>>
MSSQL日期格式转换函数(使用CONVERT)
查看>>
MSTP多生成树协议(第二课)
查看>>
MSTP是什么?有哪些专有名词?
查看>>
Mstsc 远程桌面链接 And 网络映射
查看>>
Myeclipse常用快捷键
查看>>
MyEclipse更改项目名web发布名字不改问题
查看>>
MyEclipse用(JDBC)连接SQL出现的问题~
查看>>
mt-datetime-picker type="date" 时间格式 bug
查看>>
myeclipse的新建severlet不见解决方法
查看>>
MyEclipse设置当前行背景颜色、选中单词前景色、背景色
查看>>
Mtab书签导航程序 LinkStore/getIcon SQL注入漏洞复现
查看>>
myeclipse配置springmvc教程
查看>>
MyEclipse配置SVN
查看>>
MTCNN 人脸检测
查看>>
MyEcplise中SpringBoot怎样定制启动banner?
查看>>
MyPython
查看>>
MTD技术介绍
查看>>
MySQL
查看>>