Python实现定时任务随机时间执行

149 浏览量更新于2023-05-11 1 收藏 36KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"本文主要探讨了如何在Python中实现定时任务的随机时间执行，以避免被识别为爬虫。文章提供了三种Python定时执行任务的方法，并给出了一段具体示例代码，涉及apscheduler库的使用以及随机时间间隔的生成。" 在Python中实现定时任务随机时间执行，通常我们会用到第三方库如`APScheduler`，它提供了多种调度策略，适用于不同的定时需求。本文主要关注`BackgroundScheduler`，适合在后台持续运行的任务。首先，我们需要导入相关库，包括`logging`、`traceback`、`datetime`和`apscheduler.schedulers.background`。在示例代码中，定义了一个名为`spider_schedule`的函数，这个函数将作为定时任务执行的具体内容。在函数内部，首先会移除已存在的同名job（如果有的话），然后尝试执行爬虫操作，这里留空表示实际的爬虫逻辑需要自行编写。最后，根据生成的随机分钟和秒数，使用`scheduler.add_job`添加新的定时任务，确保任务在每次执行后会在一个随机的时间间隔后再次启动。为了生成随机时间间隔，使用了Python内置的`random`库。`random.randint(60, 120)`生成1到120分钟之间的随机整数作为间隔的分钟数，`random.randint(1, 60)`生成1到60秒之间的随机整数作为间隔的秒数。这样，爬虫将在一个随机的1到2小时区间内的任意时刻启动，增加了爬虫的不可预测性，有助于避免被防爬机制识别。在主程序中，通过`scheduler.add_job`立即启动一次`spider_schedule`，以便初始化定时任务。这里设置的初始间隔仅为10秒，主要是为了演示和测试，实际应用中应替换为随机生成的值。总结来说，Python中实现定时任务随机时间执行的关键在于结合`APScheduler`库的使用以及随机时间间隔的设定。通过这样的方式，可以有效地避免因定时任务执行时间固定而被目标网站的防爬机制识别。在实际开发中，根据项目需求，可以灵活调整`apscheduler`的调度策略以及随机时间的范围，以满足不同场景下的需求。

资源详情

资源推荐

Python定时任务随机时间执行的实现方法定时任务随机时间执行的实现方法

主要介绍了Python定时任务随机时间执行的实现方法,文中给大家提到了python定时执行任务的三种方式，本文

通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下

背景：背景：

有一个爬虫服务，需要定时从公开网站上拉取一些数据，为了避免被识别为爬虫（防爬虫的识别需要根据很多特征，时间仅仅

是其中一个维度），需要在指定的时间内，随机生成一个时间爬取

脚本是python写的，直接上代码...

import logging

import traceback

from datetime import datetime

from apscheduler.schedulers.background import BackgroundScheduler

scheduler = BackgroundScheduler()

def spider_schedule():

# spider_schedule是job_id

scheduler.remove_job('spider_schedule')

try:

print 'spider start... ', datetime.now().strftime('%Y-%m-%d %X')

#--------自己的业务代码-------

pass

#---------------------------

print 'spider end... ', datetime.now().strftime('%Y-%m-%d %X')

except Exception as e:

print traceback.format_exc(e)

finally:

interval_minutes = random.randint(60, 120) # 1-120分钟随机选一个时间

interval_seconds = random.randint(1, 60) # 1~60秒随机选一个时间

scheduler.add_job(spider_schedule, 'interval', minutes=interval_minutes, seconds=interval_seconds, id='spider_schedule')

if __name__ == '__main__':

scheduler.add_job(spider_schedule, 'interval', seconds=10, id='spider_schedule')

scheduler.start()

ps：下面看下：下面看下python定时执行任务的三种方式定时执行任务的三种方式

#!/user/bin/env python

# @Time :2018/6/7 16:31

# @Author :PGIDYSQ

#@File :PerformTaskTimer.py

#定时执行任务命令

#1.定时任务代码

import time,os,sched

# schedule = sched.scheduler(time.time,time.sleep)

# def perform_command(cmd,inc):

# os.system(cmd)

# print('task')

# def timming_exe(cmd,inc=60):

# schedule.enter(inc,0,perform_command,(cmd,inc))

# schedule.run()

# print('show time after 2 seconds:')

# timming_exe('echo %time%',2)

#2.周期性执行任务

schedule = sched.scheduler(time.time,time.sleep)

def perform_command(cmd,inc):

#在inc秒后再次运行自己，即周期运行

schedule.enter(inc, 0, perform_command, (cmd, inc))

os.system(cmd)

def timming_exe(cmd,inc=60):

schedule.enter(inc,0,perform_command,(cmd,inc))

schedule.run()#持续运行，直到计划时间队列变成空为止

print('show time after 2 seconds:')

timming_exe('echo %time%',2)

#3.循环执行命令

# import time,os

# def re_exe(cmd,inc = 60):

# while True:

# os.system(cmd)

# time.sleep(inc)

# re_exe("echo %time%",5)

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余0页未读，立即下载

weixin_38530115

粉丝: 9
资源: 960

会员权益专享

Python实现定时任务随机时间执行

python每天定时运行某程序代码

Linux使用Cron+AT实现在某个确定的时间段内随机执行命令

Python定时任务工具之APScheduler使用方式

实现API自动化爬取：基于定时任务与调度

Scrapy爬虫部署与定时任务管理技巧

堆的应用之七：定时任务调度问题

WebMagic爬虫监控与管理：定时任务调度与异常处理

【Python抽奖代码秘籍】：揭秘随机抽取的奥秘，提升抽奖效率

python程序在每周六23点执行随机数函数

schedule.every(5).to(10).days.do(job)

python电影爬虫系统毕设_基于Python的豆瓣电影网络爬虫设计

给我举例若依框架一个定时任务存储json字符串查询数据于一个字段的数据表编码

schedule库的所有参数

Python真实案例

帮我设计一个python程序，可以每天帮我选择附近的外卖

如何写一个自动实时提取某网站带某关键字信息的脚本？

ipo数据获取爬虫程序

如何制作QQ机器人，我需要详细的步骤

会员权益专享

最新资源

给我举例若依框架一个定时任务存储json字符串查询数据于一个字段的数据表编码