scrapy-selenium基础使用方法大全记录

[scrapy] 2024-10-03 圈点477

摘要:scrapy-selenium基础使用方法大全记录

selenium基础使用方法大全记录


1:声明浏览器对象


# -*- coding: utf-8 -*-

from selenium import webdriver

import pdb


#声明谷歌、Firefox、Safari等浏览器

browser=webdriver.Chrome()

browser=webdriver.Firefox()

browser=webdriver.Safari()

browser=webdriver.Edge()

browser=webdriver.PhantomJS()


2.访问页面


#_*_coding: utf-8_*_

import time

from selenium import webdriver


browser=webdriver.Chrome()

browser.get("http://www.taobao.com")

time.sleep(3)

print(browser.page_source)

'''

Traceback (most recent call last):

  File "selenium4.py", line 6, in <module>

    print(browser.page_source)

  File "C:\Users\wuchan4x\AppData\Local\Continuum\anaconda2\lib\encodings\cp1252.py", line 12, in encode

    return codecs.charmap_encode(input,errors,encoding_table)

UnicodeEncodeError: 'charmap' codec can't encode characters in position 13799-13802: character maps to <undefined>

'''

print(browser.page_source.encode('utf8'))

browser.close()


3.查找单个元素


#_*_coding: utf-8_*_


from selenium import webdriver

from selenium.webdriver.common.by import By

browser=webdriver.Chrome()

browser.get("http://www.taobao.com")

input_first=browser.find_element_by_id("q")

input_second=browser.find_element_by_css_selector("#q")

input_third=browser.find_element(By.ID,"q")

print(input_first,input_second,input_third)

'''

(<selenium.webdriver.remote.webelement.WebElement (session="2846b0462091d95ca6da355fefd70808", element="0.12060594823778437-1")>, 

<selenium.webdriver.remote.webelement.WebElement (session="2846b0462091d95ca6da355fefd70808", element="0.12060594823778437-1")>, 

<selenium.webdriver.remote.webelement.WebElement (session="2846b0462091d95ca6da355fefd70808", element="0.12060594823778437-1")>)

'''

browser.close()


4.查找多个元素


#_*_coding: utf-8_*_


from selenium import webdriver

from selenium.webdriver.common.by import By

browser=webdriver.Chrome()

browser.get("http://www.taobao.com")

lis=browser.find_element_by_css_selector("li")

lis_c=browser.find_element(By.CSS_SELECTOR,"li")

#(<selenium.webdriver.remote.webelement.WebElement (session="f326ff15fb184846950679a37c7bc437", element="0.8927328599507083-2")>,

#<selenium.webdriver.remote.webelement.WebElement (session="f326ff15fb184846950679a37c7bc437", element="0.8927328599507083-2")>)

print(lis,lis_c)

browser.close()


5:元素的交互操作 

对获取到的元素调用交互方法


#_*_coding: utf-8_*_

from selenium import webdriver

import time

browser=webdriver.Chrome()

browser.get("https://www.taobao.com")

#input=browser.find_element_by_id("q")

#input=browser.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[2]/div[3]/div/input')

input=browser.find_element_by_class_name("search-combobox-input")

input.send_keys("iPhone")

browser.save_screenshot('iphone.png')

time.sleep(10)

input.clear()

input.send_keys("iPad")

button=browser.find_element_by_class_name("btn-search")

button.click()

time.sleep(10)

browser.close()


6:交互动作 

把动作附加到交互链中


#_*_coding: utf-8_*_

from selenium import webdriver

from selenium.webdriver import ActionChains

import time

from selenium.webdriver.common.alert import Alert

browser=webdriver.Chrome()

url="http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable"

browser.get(url)

#切换到目标元素所在的frame

browser.switch_to.frame("iframeResult")

#确定拖拽目标的起点

source=browser.find_element_by_id("draggable")

#确定拖拽目标的终点

target=browser.find_element_by_id("droppable")

#形成动作链

actions=ActionChains(browser)

actions.drag_and_drop(source,target)

#执行

actions.perform()

'''

1.先用switch_to_alert()方法切换到alert弹出框上

2.可以用text方法获取弹出的文本 信息

3.accept()点击确认按钮

4.dismiss()相当于点右上角x,取消弹出框

'''

t=browser.switch_to_alert()

print(t.text)

t.accept()

time.sleep(10)

browser.close()


7:执行javascript 

下面的例子是执行就是,拖拽进度条到底,并弹出提示框


#_*_coding: utf-8_*_

from selenium import webdriver

browser=webdriver.Chrome()

browser.get("https://www.zhihu.com/explore")

browser.execute_script("window.scrollTo(0,document.body.scrollHeight)")

browser.execute_script("alert('To Button')")

browser.close()


8:获取元素信息 

获取属性


# -*- coding: utf-8 -*-

from selenium import webdriver

browser=webdriver.Chrome()

url='https://www.zhihu.com/explore'

browser.get(url)

browser.implicitly_wait(10)

logo=browser.find_element_by_id('zh-top-link-logo')

print(logo)

#<selenium.webdriver.remote.webelement.WebElement (session="4d57a638f4970f803c603c8fd677f77a", element="0.949410104143495-1")>

print(logo.id)

#0.949410104143495-1

print(logo.size)

#{'width': 61, 'height': 45}

print(logo.location)

#{'y': 0.0, 'x': 10.0}

print(logo.tag_name)

#a

print(logo.text)

#u'\u77e5\u4e4e'

browser.close()


9:等待 

隐式等待 

当使用了隐式等待执行测试的时候,如果webdriver没有在DOM中找到元素,将继续等待,超过设定的时间后则抛出找不到元素的异常,换句话说,当查找元素或元素并没有立即出现的时候,隐式等待将等待一段时间再查找DOM,默认时间为0.


# -*- coding: utf-8 -*-

from selenium import webdriver


browser=webdriver.Chrome()

url="https://www.zhihu.com/explore"

browser.get(url)

browser.implicitly_wait(10)

logo=browser.find_element_by_id("zh-top-link-logo")

print(logo)

browser.close()


显示等待


# -*- coding: utf-8 -*-

from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC


browser=webdriver.Chrome()

url="https://www.taobao.com"

browser.get(url)

wait=WebDriverWait(browser,10)

input=wait.until(EC.presence_of_element_located((By.ID,"q")))

button=wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,".btn-search")))

print(input,button)

browser.close()


10:浏览器的前进和后退


# -*- coding: utf-8 -*-

from selenium import webdriver

import time


browser=webdriver.Chrome()

browser.get("https://www.taobao.com")

browser.get("https://www.baidu.com")

browser.get("https://www.python.org")

browser.back()

time.sleep(1)

browser.forward()

browser.close()


11:cookies的处理


# -*- coding: utf-8 -*-

from selenium import webdriver

import time


browser=webdriver.Chrome()

browser.get("https://www.zhihu.com/explore")

print(browser.get_cookies())

browser.add_cookie({"name":"name","domain":"www.zhihu.com","value":"germey"})

print(browser.get_cookies())

browser.delete_all_cookies()

print(browser.get_cookies())

browser.close()


12:选项卡管理


# -*- coding: utf-8 -*-

from selenium import webdriver

import time


browser=webdriver.Chrome()

browser.get("https://www.zhihu.com/explore")

browser.execute_script("window.open()")

print(browser.window_handles)

browser.switch_to_window(browser.window_handles[1])

browser.get("https://www.taobao.com")

time.sleep(1)

browser.switch_to_window(browser.window_handles[0])

browser.get("https://python.org")

browser.close()


13:异常处理


# -*- coding: utf-8 -*-

from selenium import webdriver

from selenium.common.exceptions import TimeoutException,NoSuchElementException


browser=webdriver.Chrome()

try:

    browser.get("https://www.zhihu.com/explore")

except TimeoutException:

    print("Time out")

try:

    browser.find_element_by_id("hello")

except NoSuchElementException:

    print("No Element")

finally:

    browser.close()



查找元素


input=browser.find_element_by_id("q")

input=browser.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[2]/div[3]/div/input')

input=browser.find_element_by_class_name("search-combobox-input")

driver.find_element_by_name('t2').get_attribute('value')

driver.find_element_by_xpath('//input[@value="dbl click me"]')

driver.find_element_by_xpath('//textarea[@name="t2"]').get_attribute('value')#获取文本框中的内容

driver.find_element_by_name('t2').get_attribute('value')

find_elements_by_link_text

find_elements_by_partial_link_text

find_elements_by_tag_name


鼠标操作


click(on_element=None)  ——单击鼠标左键

click_and_hold(on_element=None)  ——点击鼠标左键,不松开

context_click(on_element=None)  ——点击鼠标右键

double_click(on_element=None)  ——双击鼠标左键

drag_and_drop(source, target)  ——拖拽到某个元素然后松开

drag_and_drop_by_offset(source, xoffset, yoffset)  ——拖拽到某个坐标然后松开

key_down(value, element=None)  ——按下某个键盘上的键

key_up(value, element=None)  ——松开某个键

move_by_offset(xoffset, yoffset)  ——鼠标从当前位置移动到某个坐标

move_to_element(to_element)  ——鼠标移动到某个元素

move_to_element_with_offset(to_element, xoffset, yoffset)  ——移动到距某个元素(左上角坐标)多少距离的位置

perform()  ——执行链中的所有动作

release(on_element=None) ——在某个元素位置松开鼠标左键

send_keys(*keys_to_send)  ——发送某个键到当前焦点的元素

send_keys_to_element(element, *keys_to_send)  ——发送某个键到指定元素


selenium  

感谢反馈,已提交成功,审核后即会显示