-
Notifications
You must be signed in to change notification settings - Fork 1
Log Format pt BR
Uma série de formatos de linha são suportados. É importante que cada linha contenha o IP real (IPv4 ou IPv6) da URL acessada, o dia e hora de cada acesso, o método HTTP de acesso (GET), o código de status do acesso (200, 204, 301, entre outros), a URL acessada e o agente de usuário utilizado para obter o conteúdo (por exemplo, navegador em dispositivo móvel). Outras informações como tamanho do conteúdo e tempo de resposta também podem compor o log.
É extremamente importante que o IP fornecido em cada linha de log seja o real, pois essa informação é usada para determinar uma sessão de usuário, conceito que é usado nos passos seguintes da calculadora de acessos para remoção de cliques duplos e outros ruídos que aumentam de maneira artificial os resultados. Caso o IP fornecido seja local (127.0.0.1, 168.0.0.1, 17.0.0.1, 10.0.0.1, entre outros) ou esteja ausente, a linha é descartada, pois não permite a definição de uma sessão de usuário - isso invialibiza a contegem de acessos nos moldes do Project COUNTER R5.
Caso o acesso seja feito por um agente de usuário que não seja um navegador web, como um robô ou um crawler, a linha também é descartada. As URLs que representam arquivos estáticos (por exemplo, imagens, folhas de estilo, entre outros) também são descartadas. A seguir, são elencados alguns exemplos de linhas de log válidas, isto é, que representam acessos às páginas de artigos em formato de resumo ou completo:
- scielo.isciii.es 117.64.147.191 - - [12/Feb/2024:04:23:09 +0100] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 18575 "-" "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36" 90571 364 18950
- 45.65.189.47 45.65.189.47, 198.41.230.129 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
- 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:12 0300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
- 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:120300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
- 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
- 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
A tabela seguinte elenca os campos esperados/detectados em cada linha de log destacada na lista anterior:
| IP | Método HTTP | Código HTTP | URL | Agente de Usuário |
|---|---|---|---|---|
| 117.64.147.191 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36 |
| 45.65.189.47 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15 |
| 186.130.151.215 | GET | 304 | /scielo.php?pid=S0718-07642017000400014&script=sci_arttext | Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36 |
| 186.130.151.215 | GET | 304 | /scielo.php?pid=S0718-07642017000400014&script=sci_arttext | Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36 |
| 45.65.189.47 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15 |
| 45.65.189.47 | GET | 200 | /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract | Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15 |