我正在学习f#,我已经开始玩这两个序列和match
表达式。
我正在写一个web scraper,它通过类似于下面的HTML查找,并在paging
类的父<span>
中获取最后一个URL。
<html>
<body>
<span class="paging">
<a href="http://google.com">Link to Google</a>
<a href="http://TheLinkIWant.com">The Link I want</a>
</span>
</body>
</html>
我试图得到最后一个URL如下:
type AnHtmlPage = FSharp.Data.HtmlProvider<"http://somesite.com">
let findMaxPageNumber (page:AnHtmlPage)=
page.Html.Descendants()
|> Seq.filter(fun n -> n.HasClass("paging"))
|> Seq.collect(fun n -> n.Descendants() |> Seq.filter(fun m -> m.HasName("a")))
|> Seq.last
|> fun n -> n.AttributeValue("href")
然而,当我正在搜索的类不在页面上时,我遇到了问题。特别是我得到ArgumentExceptions与消息:Additional information: The input sequence was empty.
我的第一个想法是构建另一个函数,该函数匹配空序列,并在页面上没有找到paging
类时返回空字符串。
let findUrlOrReturnEmptyString (span:seq<HtmlNode>) =
match span with
| Seq.empty -> String.Empty // <----- This is invalid
| span -> span
|> Seq.collect(fun (n:HtmlNode) -> n.Descendants() |> Seq.filter(fun m -> m.HasName("a")))
|> Seq.last
|> fun n -> n.AttributeValue("href")
let findMaxPageNumber (page:AnHtmlPage)=
page.Html.Descendants()
|> Seq.filter(fun n -> n.HasClass("paging"))
|> findUrlOrReturnEmptyStrin
我现在的问题是Seq.Empty
不是字面量,不能在模式中使用。大多数具有模式匹配的示例在其模式中指定空列表[]
,因此我想知道:我如何使用类似的方法并匹配空序列?
ildjarn在评论中给出的建议是一个很好的建议:如果您觉得使用match
将创建更可读的代码,那么创建一个活动模式来检查空序列:
let (|EmptySeq|_|) a = if Seq.isEmpty a then Some () else None
let s0 = Seq.empty<int>
match s0 with
| EmptySeq -> "empty"
| _ -> "not empty"
在f#交互式中运行,结果将是"empty"
您可以使用when
保护来进一步限定这种情况:
match span with
| sequence when Seq.isEmpty sequence -> String.Empty
| span -> span
|> Seq.collect (fun (n: HtmlNode) ->
n.Descendants()
|> Seq.filter (fun m -> m.HasName("a")))
|> Seq.last
|> fun n -> n.AttributeValue("href")
ildjarn是正确的,因为在这种情况下,if...then...else
可能是更可读的选择。
使用保护子句
match myseq with
| s when Seq.isEmpty s -> "empty"
| _ -> "not empty"
基于@rmunn的答案,您可以创建一个更通用的序列相等活动模式。
let (|Seq|_|) test input =
if Seq.compareWith Operators.compare input test = 0
then Some ()
else None
match [] with
| Seq [] -> "empty"
| _ -> "not empty"