我想编写trycatch代码来处理从Web下载时出现的错误。

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)


这两个语句成功运行。在下面,我创建了一个不存在的网址:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")


url[1]不存在。如何编写一个trycatch循环(函数),以便:


URL错误时,输出为:“ Web URL错误,无法获取”。
如果URL错误,则代码不会停止,而是继续下载直到URL列表的末尾?


#1 楼

那么,那么:欢迎来到R世界;-)
这里
设置代码
urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped inside a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

应用代码
> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

调查输出
> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

其他说明
tryCatch
tryCatch返回与执行expr相关的值,除非有错误或警告。在这种情况下,可以通过提供相应的处理函数来指定特定的返回值(请参见上面的return(NA))(请参阅error中的参数warning?tryCatch)。这些可以是已经存在的函数,但是您也可以在tryCatch()中定义它们(如我在上面所做的那样)。
选择处理程序函数的特定返回值的含义
我们已经指定NA应该如果出错则返回,则y中的第三个元素是NA。如果我们选择NULL作为返回值,则y的长度应该是2而不是3,因为lapply()只会“忽略”返回值NULL。另请注意,如果未通过return()指定显式的返回值,则处理函数将返回NULL(即,在出现错误或警告条件的情况下)。
“不需要的”警告消息
warn=FALSE似乎没有任何效果,抑制警告的另一种方法(在这种情况下,它不是很重要)是使用
suppressWarnings(readLines(con=url))
readLines(con=url, warn=FALSE)

多个表达式
请注意,如果将它们用大括号括起来,也可以在“实际表达式部分”(expr的参数tryCatch())中放置多个表达式(就像我在finally部分中说明的那样)。

评论


@seancarmody:true ;-)我只是习惯将更长/更复杂的字符串放在一起,因为我必须通过实际写出它们来控制空格。

–雷珀斯
2012年8月30日12:00

您应该为此使用paste0!

–seancarmody
2012年8月30日13:02

paste0()在基础中。在内部,paste()和paste0()都在paste.c中调用do_paste。唯一的区别是paste0()不传递sep参数。

– jthetzel
2012年8月30日14:04

@JulienNavarre:请记住,“ try部件”总是返回最后一个对象(当前为readLines(con = url,warn = FALSE),这可能会出错)。因此,如果您想添加一条消息,则需要将实际的retun值存储在一个变量中:out <-readLines(con = url,warn = FALSE),然后是message(“一切正常”),然后依次是out使它成为最后一个实际返回的对象

–雷珀斯
2015年4月23日12:28



很棒的例子,有据可查。我是否可以删除所有关于诸如粘贴/粘贴0之类的琐碎问题的评论者,以免我们在这一部分中不涉及无关紧要的内容?谢谢。

–拉撒路·瑟斯顿(Lazarus Thurston)
1月31日12:08

#2 楼

R使用函数来实现try-catch块:

语法有点像这样:

result = tryCatch({
    expr
}, warning = function(warning_condition) {
    warning-handler-code
}, error = function(error_condition) {
    error-handler-code
}, finally={
    cleanup-code
})


tryCatch()中有两个'可以处理的“条件”:“警告”和“错误”。编写每个代码块时要了解的重要事项是执行状态和范围。
@source

评论


将错误处理程序代码替换为cat(“ Web网址错误,无法获取”)

–seancarmody
2012年8月30日在10:03

你忽略了消息捕捉

–原始
2015年12月15日在21:37

#3 楼

tryCatch具有稍微复杂的语法结构。但是,一旦我们理解构成一个完整的tryCatch调用的4个部分(如下所示),就很容易记住:

expr:[必需]要评估的R代码

错误:[可选]如果在评估expr中的代码时发生错误,应该怎么办

警告:[可选]如果在评估expr中的代码时发生警告,应该如何办? >
最后:[可选]不管是否成功运行expr,是否出现错误或警告,都应在退出tryCatch调用之前立即运行什么

tryCatch(
    expr = {
        # Your code...
        # goes here...
        # ...
    },
    error = function(e){ 
        # (Optional)
        # Do this if an error is caught...
    },
    warning = function(w){
        # (Optional)
        # Do this if an warning is caught...
    },
    finally = {
        # (Optional)
        # Do this at the end before quitting the tryCatch structure...
    }
)


因此,作为一个玩具示例,计算值的对数可能看起来像:

log_calculator <- function(x){
    tryCatch(
        expr = {
            message(log(x))
            message("Successfully executed the log(x) call.")
        },
        error = function(e){
            message('Caught an error!')
            print(e)
        },
        warning = function(w){
            message('Caught an warning!')
            print(w)
        },
        finally = {
            message('All done, quitting.')
        }
    )    
}


现在,运行三种情况:

有效案例

log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.


“警告”案例

log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.


“错误”案例

log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.


我写了一些我经常使用的有用用例。在此处查找更多详细信息:https://rsangole.netlify.com/post/try-catch/

希望这会有所帮助。

#4 楼

这是一个简单的示例:

# Do something, or tell me why it failed
my_update_function <- function(x){
    tryCatch(
        # This is what I want to do...
        {
        y = x * 2
        return(y)
        },
        # ... but if an error occurs, tell me what happened: 
        error=function(error_message) {
            message("This is my custom message.")
            message("And below is the error message from R:")
            message(error_message)
            return(NA)
        }
    )
}


如果您还想捕获“警告”,只需添加与warning=部分类似的error=

评论


由于有两行而不是一行,因此expr部分周围是否应该有大括号?

– Paul
18年8月14日在21:22

谢谢!仔细检查后,我看不到需要大括号

– Paul
18年8月15日在17:49

感谢您仔细检查。当我运行您的代码时,在“)”中收到错误:意外的')',在“)”中出现错误:意外的')'。添加一对大括号即可解决此问题。

– Paul
18年8月15日在21:46

对于大多数用例,您是对的,谢谢!已修复。

– Paul
18年10月10日在19:13

#5 楼

因为我只是失去了我的生活两天试图为tryCatch解决一个IRR函数,我想我应该分享我的智慧(和缺什么)。 FYI-在这种情况下,irr是FinCal的实际功能,在某些情况下,大型数据集在某些情况下会出错。



将tryCatch设置为功能的一部分。例如:

irr2 <- function (x) {
  out <- tryCatch(irr(x), error = function(e) NULL)
  return(out)
}


要使错误(或警告)生效,实际上需要创建一个函数。我最初对于错误部分只写了error = return(NULL),所有值都返回了null。
记得创建一个子输出(例如我的“ out”)并添加到return(out)


评论


为什么3号是必要的?

– jan-glx
17年12月21日在9:59