linux下载远程文件,linux远程下载工具

  linux下载远程文件,linux远程下载工具

  转自:http://www..com/peida/archive/2013/03/18/2965369.html

  Linux系统中的Wget是一个下载文件的工具,在命令行下使用。作为Linux用户不可或缺的工具,我们经常会从远程服务器下载一些软件或将备份恢复到本地服务器。Wget支持HTTP、HTTPS和FTP协议,可以使用HTTP代理。所谓自动下载,就是用户退出系统后,可以在后台执行wget。这意味着您可以登录到系统,启动一个wget下载任务,然后从系统中注销。wget会在后台执行,直到任务完成,相比其他大多数浏览器在下载大量数据时需要用户不断参与,省去了很多麻烦。

  Wget可以按照HTML页面上的链接依次下载,创建远程服务器的本地版本,完全重建原站点的目录结构。这通常被称为“递归下载”。递归下载时,wget遵循RobotExclusion标准(/robots.txt)。wget可以在下载的同时将链接转换为本地文件,方便离线浏览。

  Wget非常稳定,在带宽窄、网络不稳定的情况下适应性很强。如果由于网络原因下载失败,wget会一直尝试,直到下载完整个文件。如果服务器中断下载过程,它将再次连接到服务器,并从停止的地方继续下载。这对于从链接时间有限的服务器下载大文件非常有用。

  1.命令格式:

  Wget[参数][URL地址]

  2.命令功能:

  用于从网络下载资源。没有指定目录,默认情况下,下载的资源返回到当前目录。虽然wget功能强大,但使用起来仍然相对简单:

  1)支持断点下载功能;这也是当年netants和FlashGet最大的卖点。现在Wget也可以用这个功能了,那些网络不是那么好的用户可以放心;

  2)同时支持FTP和HTTP下载方式;虽然现在大部分软件都可以通过HTTP下载,但是有时候还是需要通过FTP下载软件。

  3)支持代理服务器;对于安全强度较高的系统,其自身系统一般不会直接暴露在互联网上,所以支持代理是下载软件的必备功能;

  4)设置方便简单;也许,习惯了图形界面的用户不习惯命令行,但命令行其实在设置上更有优势。至少鼠标可以少点很多次,不用担心鼠标是不是点错了。

  5)程序小,完全免费;小程序可以忽略,因为目前硬盘太大;我们必须考虑完全免费。即使网上有很多所谓的免费软件,但这些软件的广告并不是我们喜欢的。

  3.命令参数:

  启动参数:

  -v,version显示wget的版本并退出。

  -h,帮助打印语法帮助

  -b,后台启动并在后台执行。

  -e,execute=command执行中的命令。“wgetrc”格式。请参见/etc/wgetrc或~/。wgetrc格式的wgetrc。

  并记录输入文件参数:

  -o,output-FILE=FILE将记录写入文件。

  -a,append-output=FILE将记录追加到文件中。

  -d,调试打印调试输出

  -q,安静模式(无输出)

  -v,详细模式(这是默认设置)

  -NV,non-verbose关闭详细模式,但不关闭安静模式。

  -I,input-FILE=文件文件中出现的文件下载URL

  -f,force-HTML将输入文件视为HTML文件。

  -b,base=URL将URL作为相对链接的前缀,该链接出现在由-F-i参数指定的文件中。

  -sslcertfile=FILE可选客户端证书

  可选客户端证书的sslcertkey=keyfileKeyfile

  EGD-file=file指定EGDsocket的文件名。

  下载参数:

  bind-bind-ADDRESS=ADDRESS指定本地地址(主机名或IP,当本地区域有多个IP或名称时使用)

  -t,tries=number设置链接尝试的最大次数(0表示无限制)。

  -ooutput-document=FILE将文档写入文件FILE。

  -nc,-NC,-no-clobber不要覆盖现有文件或使用。#前缀。

  -c,继续然后下载未完成的文件。

  -progress=TYPE设置进度条标志。

  -n,时间戳除非文件比本地文件新,否则不要再次下载文件。

  -s,server-response打印服务器的响应。

  蜘蛛不下载任何东西

  -t,time out=seconds设置响应超时的秒数。

  -w,wait=SECONDS两次尝试之间的间隔是秒。

  -Wait retry=SECONDS在重新链接之间等待1…秒。

  -random-WAIT下载之间等待0…2 *秒

  -y,proxy=on/off打开或关闭代理。

  -q,quota=number设置下载容量限制。

  -limit-RATE=RATE=RATE限制下载速率。

  目录参数:

  -ndno-directory不创建目录。

  -x,force-directory强制创建目录。

  -NH,no-host-directory不创建主机目录。

  -p,directory-PREFIX=PREFIX将文件保存到目录前缀/…

  cut-cut-dirs=NUMBER忽略数字级远程目录

  HTTP选项参数:

  HTTP-USER=USER将HTTP用户名设置为USER。

  http-http-PASSwd=PASS设置http密码以通过

  -c,cache=on/off允许/不允许服务器端的数据缓存(通常是允许的)

  -e,html-extension用。html扩展。

  -ignore-length忽略“内容长度”标题字段。

  -header=STRING在标题中插入字符串。

  proxy-USER=USER设置-proxy-user=USER的用户名。

  proxy-PASSwd=pass设置要通过的代理的密码。

  -referer=URL在HTTP请求中包含“referer: URL”标头

  -s,save-headers将HTTP头保存到文件中。

  -u,user-AGENT=AGENT将代理的名称设置为AGENT,而不是Wget/VERSION。

  No-HTTP-keep-alive关闭HTTP活动链接(永远链接)

  -cookie=不使用关闭的cookie

  load-cookies=FILE-load-cookies=FILE启动会话前的文件文件。

  Save-cookies=FILE会话结束后,将cookie保存到文件中。

  FTP的选项参数:

  -NR,dont-remove-listing不会删除`。“列表”文件。

  -g,glob=on/off打开或关闭文件名的globbing机制。

  -passive-FTP使用被动传输模式(默认)。

  -active-FTP使用主动传输模式。

  -retr-symlinks递归时指向文件(而不是目录)的链接。

  递归下载参数:

  -r,-递归递归下载-慎用!

  -l,level=数字最大递归深度(inf或0表示无穷大)

  -delete-after现在完成后部分删除文件。

  -k,convert-links将非相对链接转换为相对链接。

  -k,backup-converted在转换文件X之前将其备份为X.orig。

  -m,mirror相当于-r-N-linf-nr。

  -p,page-需求下载所有显示HTML文件的图片。

  递归下载中的包含和排除(接受/拒绝):

  -a,accept=list分号分隔的已接受扩展名列表。

  -r,reject=list分号分隔的不可接受扩展名列表。

  -d,domains=list分号分隔的接受域列表。

  exclude-domains=list分号分隔的不可接受域列表

  follow-ftp跟踪HTML文档中的FTP链接

  follow-tags=list分号分隔的跟踪HTML标记列表

  -g,ignore-tags=list分号分隔的被忽略的HTML标记列表

  -h,span-递归时主机转到外部主机

  -l,relative仅跟踪相对链接。

  -I,include-directory=List允许的目录列表

  -x,exclude-directory=list不包括的目录列表。

  -np,-NP,-no-parent不追溯到父目录。

  WGET-S-蜘蛛网址不下载,只显示过程

  4.使用示例:

  示例1:使用wget下载单个文件

  命令:

  wgethttp://www.minjieren.com/wordpress-3.1-zh_CN.zip

  描述:

  下面的例子是从网络上下载一个文件并保存在当前目录下。在下载过程中,将显示一个进度条,包括(下载完成百分比、已下载字节数、当前下载速度、剩余下载时间)。

  示例2:用wget-O下载并用不同的文件名保存

  命令:

  :wget-Owordpress.ziphttp://www.minjieren.com/download.aspx? id=1080

  描述:

  默认情况下,Wget命令的最后一个字符与“/”匹配,文件名通常不适合下载动态链接。

  错误:以下示例将下载一个名为download.aspx?Id=1080保存

  wgethttp://www.minjieren.com/download? id=1

  即使下载的文件是zip格式,它仍然在downloaded?Id=1080命令。

  正确:为了解决这个问题,我们可以使用参数-O来指定一个文件名:

  wget-Owordpress.ziphttp://www.minjieren.com/download.aspx?id=1080

  示例3:使用WGET-限制速率来限制下载速度

  命令:

  wget-limit-rate=300k http://www . min jieren . com/WordPress-3.1-zh _ cn . zip

  描述:

  当你执行wget时,默认情况下会占用所有可能的宽带下载。但是当你要下载一个大文件,又需要下载其他文件的时候,限制速度就很有必要了。

  示例4:使用wget-c断点继续

  命令:

  wget-chttp://www.minjieren.com/wordpress-3.1-zh_CN.zip

  描述:

  使用wget-c重启中断文件的下载,对于我们下载由于网络等原因突然中断的大文件非常有帮助。我们可以继续下载它们,而不是再次下载文件。当您需要继续中断的下载时,可以使用-c参数。

  示例5:使用wget-b进行后台下载

  命令:

  wget-bhttp://www.minjieren.com/wordpress-3.1-zh_CN.zip

  描述:

  当下载非常大的文件时,我们可以使用参数-b进行后台下载。

  wget-bhttp://www.minjieren.com/wordpress-3.1-zh_CN.zip

  继续背景,pid1840。

  Outputwillbewrittento`wget-log 。

  您可以使用以下命令来检查下载进度:

  tail-fwget-log

  示例6:伪装的代理名称下载

  命令:

  wget-user-agent= Mozilla/5.0(Windows;u;WindowsNT6.1en-US)AppleWebKit/534.16(KHTML,like gecko)Chrome/10 . 0 . 648 . 204 safari/534.16 http://www . minjieren . com/WordPress-3.1-zh _ cn . zip

  描述:

  有些网站可以通过判断代理名称不是浏览器来拒绝你的下载请求。但是您可以通过- user-agent参数来伪装它。

  示例7:使用wget-spider测试下载链接

  命令:

  wget -蜘蛛URL

  描述:

  当您计划定期下载时,您应该在预定时间测试下载链接是否有效。我们可以添加- spider参数进行检查。

  wget -蜘蛛URL

  如果下载链接正确,就会显示出来。

  wget -蜘蛛URL

  spidermodeenabled . checkifremotefileexists。

  HTTPrequestsent,awaitingresponse.200OK

  长度:未指定[文本/html]

  remotefileexistsandcouldcontainfurterlinks,

  butrecursionisdisabled-not retrieving。

  这确保了下载可以在预定的时间进行,但是当您给出一个错误的链接时,将会显示以下错误。

  wget -蜘蛛url

  spidermodeenabled . checkifremotefileexists。

  HTTPrequestsent,awaitingresponse.404未找到

  remotefiledoesnotexist-broken link!

  您可以在下列情况下使用spider参数:

  定期下载前检查。

  查看interval网站是否可用。

  检查网站页面的死链接。

  示例8:使用wget-trys增加重试次数

  命令:

  wget - tries=40URL

  描述:

  如果网络有问题或下载大文件,也可能会失败。默认情况下,Wget会重试20次来连接下载文件。如有必要,您可以使用-尝试增加重试次数。

  示例9:使用wget-i下载多个文件

  命令:

  wget-ifilelist.txt

  描述:

  首先,保存一个下载链接文件。

  cat文件列表. txt

  url1

  url2

  url3

  url4

  然后使用这个文件和参数-i来下载。

  示例10:使用wget-mirror镜像网站

  命令:

  wget-mirror-p-convert-links-p ./local URL

  描述:

  在本地下载整个网站。

  镜像:开户镜像下载

  -p:下载html页面正常的所有文件。

  -转换-链接:下载后,转换成本地链接。

  -P./LOCAL:将所有文件和目录保存到本地指定目录。

  示例11:使用wget-reject过滤指定格式的下载

  命令:

  wget - reject=gifur

  描述:

  要下载一个网站,但你不想下载图片,你可以使用下面的命令。

  示例12:使用wget-o将下载信息保存到日志文件中

  命令:

  wget-odownload.logURL

  描述:

  你不希望下载的信息直接显示在终端,而是显示在一个日志文件中,可以使用。

  示例13:使用wget-Q限制下载文件的总大小

  命令:

  wget-Q5m-ifilelist.txt

  描述:

  当您要下载的文件超过5M并退出下载时,您可以使用。注意:该参数不适用于单个文件下载,仅在递归下载时有效。

  示例14:使用wget-r-A下载指定格式的文件

  命令:

  wget-r-A.pdfurl

  描述:

  您可以在以下情况下使用此功能:

  下载一个网站的所有图片

  下载网站的所有视频

  下载网站的所有PDF文件

  示例15:使用wgetFTP下载

  命令:

  wgetftp-url

  wget-FTP-user=用户名-FTP-密码=密码url

  描述:

  可以使用wget下载ftp链接。

  使用wget匿名ftp下载:

  wgetftp-url

  使用wget用户名和密码验证的Ftp下载

  wget-FTP-user=用户名-FTP-密码=密码url

  备注:编译并安装。

  使用以下命令编译安装:

  #tarzxvfwget-1.9.1.tar.gz

  #cdwget-1.9.1

  #./配置

  #制造

  #makeinstall

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: