• 全部
  • 互动交流
  • 文章分享

python3 如何读取IHTMLDocument2的内容,url被加密。

putiss 2020-08-06 04:39:15
python3 如何读取IHTMLDocument2的文本内容,url被加密。感谢。
...全文
54 点赞 收藏 2
写回复
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
putiss 2020-09-05
找到了,可以直接读取body.innerTEXT即可,谢谢。
由于初学者,还不知道如何去输入文本。

引用 楼主 putiss 的回复:
python3 如何读取IHTMLDocument2的文本内容,url被加密。感谢。
回复
青柍 2020-09-02
试试selenium呢?
回复
putiss 2020-08-06
#!/usr/bin/env python
#coding:utf-8


import sys

sys.coinit_flags = 0 # pythoncom.COINIT_MULTITHREADED

import win32com
import win32com.client
import win32gui
import win32con
import pythoncom

def getIEServer(hwnd, ieServer):
if win32gui.GetClassName(hwnd) == 'Internet Explorer_Server':
ieServer.append(hwnd)

if __name__ == '__main__':
mainHwnd = win32gui.FindWindow(None, u"xxxxxxx")

print("%x" %(mainHwnd))
if mainHwnd:
ieServers = []
win32gui.EnumChildWindows(mainHwnd, getIEServer, ieServers)
print(len(ieServers))
if len(ieServers) > 0:
ieServer = ieServers[0]
print("%x" %(ieServer))
msg = win32gui.RegisterWindowMessage('WM_HTML_GETOBJECT')
print(msg)
ret, result = win32gui.SendMessageTimeout(ieServer, msg, 0, 0, win32con.SMTO_ABORTIFHUNG, 1000)
ob = pythoncom.ObjectFromLresult(result, pythoncom.IID_IDispatch, 0)
print(ob)
doc = win32com.client.dynamic.Dispatch(ob)

print(doc.links)
print(doc.url)
print(doc.nameProp)
回复
相关推荐
发帖
脚本语言
创建于2007-08-27

3.7w+

社区成员

JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
申请成为版主
帖子事件
创建了帖子
2020-08-06 04:39
社区公告

CSDN 脚本语言社区接受专栏投稿(专栏会在顶部创建专属你的栏目),投稿需满足以下要求:

  • 脚本语言技术相关;
  • 文章持续更新,保持活跃;
  • 内容清晰明了,干货为主;
  • 文章排版有序,有条有理。

本社区开通招聘专栏,发布招聘信息请联系版主,发布者需要保证招聘信息真实有效,CSDN 平台和版主不对招聘内容负责!

联系方式:私聊版主、发送邮件、QQ联系等均可: