RDot: White Hat Security Community

RDot: White Hat Security Community (https://rdot.org/forum/index.php)
-   Оффтоп/Offtopic (https://rdot.org/forum/forumdisplay.php?f=12)
-   -   накодить (https://rdot.org/forum/showthread.php?t=609)

shuba 26.08.2010 13:53

накодить
 
Народ, помогите мне очистить текстовый файл от лабуды всякой...
вот у меня есть список доменов:

Код:

http://www.jimyaghi.com/ppc-lead-generation/ppc-product-review/seo-networkers-intrusive-case-study-videos/comment-page-1#comment-2046
http://landrules.com/2009/04/12/tulsa-online-20-presentation/comment-page-1/#comment-2733/
http://beachbumphotography.net/
http://endlessyears.com/
http://recapitalization.com.ua/
http://hknepal.com/wp/
http://neftali.clubdelphi.com/
http://www.sudostroybank.ru/
http://banksinthetank.com/blog/
http://blogs.radiopodlasie.pl/bp/
http://battlezfmx.com/blog/2009/02/08/prayers-for-jeremy-lusk-crash-at-x-nights-costa-rica/%25&evalbase64_decode_SERVERHTTP_EXECCODE.%2B&%25/#comment-4169
http://bhabiejhoice-xoxo.net/archives/1278#comment-178902/

Мне надо привести их к виду
Код:

http://site.com/
и
Код:

http://site.com/blog/
Т.е очистить его от всяких
Код:

2009/04/12/tulsa-online-20-presentation/comment-page-1/#comment-2733/
Кто нить может такое сделать?

Null 26.08.2010 14:21

PHP код:

<?php
$array 
= array (
'http://www.jimyaghi.com/ppew/seo-nmment-page-1#comment-2046',
'http://landrules.com/2009/04/12/ge-1/#comment-2733/',
'http://beachbumphotography.net/',
'http://endlessyears.com/',
'4ewgdvdfgb'
);
foreach(
$array as $val)
{
  if(
strstr($val,'http://'))
  {
    
$val preg_replace('/(http:\/\/[^\/]+).+$/''$1/'$val);
    
$r .= $val."\n";
  }
}
echo 
$r;
?>


SpangeBoB 26.08.2010 14:32

На Powershell:
Цитата:

gc site.txt | % {"http://"+($_ -split "/",4)[2] | %{"$_/`n"+$_+"/blog/" }} | Out-File result.txt


Часовой пояс GMT +3, время: 19:03.

Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2022, Jelsoft Enterprises Ltd. Перевод: zCarot