日数計算 との違い。POSIXct/として。文字ベクトルを POSIXct/POSIXlt に変換するための POSIXlt および strptime



r 日数計算 (2)

私は、文字ベクトルを日時クラスに変換する方法について質問する、ここでいくつかの質問に従ってきました。 私はしばしば2つのメソッド、strptimeとas.POSIXct / as.POSIXltメソッドを見ます。 私は2つの機能を見ていましたが、違いは何かわかりません。

strptime

function (x, format, tz = "") 
{
    y <- .Internal(strptime(as.character(x), format, tz))
    names(y$year) <- names(x)
    y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>

as.POSIXct

function (x, tz = "", ...) 
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>

as.POSIXlt

function (x, tz = "", ...) 
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>

パフォーマンスの違いがあるかどうかを確認するためにマイクロベンチマークを実行する:

library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)

Unit: milliseconds
                                    expr      min       lq   median       uq      max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2            strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422

strptimeは少し速いようです。 だから何を与える? なぜ2つの同様の機能があるのでしょうか、それとも私が見逃した違いがありますか?


Answer #1

さて、関数はさまざまなことをします。

まず、日付/時刻の内部実装には、UNIXエポックからの秒数(+その他のデータ)を格納するPOSIXct 、日、月、年、時、分、秒などのリストを格納するPOSIXltという2つの内部実装があります。

strptimeは、(さまざまな形式の)文字ベクトルをPOSIXlt形式に直接変換する関数です。

as.POSIXlt 、さまざまなデータ型をas.POSIXlt変換しPOSIXlt 。 それは知的であり、賢明なことをしようとします - 文字の場合、それはstrptimeへのラッパーとして機能します。

POSIXctはさまざまなデータ型をPOSIXct変換します。 それはまた、インテリジェントであり、賢明なことを試みます。文字の場合は、最初にstrptime実行し、次にPOSIXltからPOSIXct変換します。

strptimeは文字入力のみを扱い、他の人は入力型からどのメソッドを使用するかを決定しようとするので、 strptimeは高速です。 また、あなたが望むものではないかもしれないインテリジェントなことをやろうとするのではなく、予期しないデータを渡すだけで、エラーが発生するという点で少し安全です。


Answer #2

POSIXtとPOSIXltという2つのPOSIXt型があります。 "ct"はカレンダー時間を表すことができ、起点からの秒数を格納します。 "lt"または現地時間は、時間属性のリスト( "時"や "月"など)として日付を保持します。 次の例を試してください:

date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")

date=c("26/10/2016")

time=c("19:51:30")

day<-paste(date,"T", time)

day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time1

day.time1$year

day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time2

day.time2$year




benchmarking