как использовать метод анализа markdown в php для создания отдельного автоматизированного процесса

Я хочу разработать веб-сайт с небольшим автоматизированным процессом или заголовком, меню, панелью навигации, нижним колонтитулом и т. Д., Который использует технику уценки.

Например, navigationbar.md будет содержать только текст ссылки и адрес ссылки, я хочу получить эти данные по отдельности (ссылку и текст без разбора в формате html) в переменные или параметры в php.

* [Dog][0]
* [German Shepherd][1]
* [Belgian Shepherd][2]
    * [Malinois][3]
    * [Groenendael][4]
    * [Tervuren][5]
* [Cat][6]
    * [Siberian][7]
    * [Siamese][8]


Если здесь не нужен html-код, я хочу, чтобы вложенный массив содержал текст ссылки и адрес ссылки

Эта структура уценки создаст вывод html следующим образом

enter image description here

Но мне нужен этот список в виде вложенного массива для выполнения определенных задач.

Дайте мне знать, если это сработает.. есть ли у них хоть какой-то шанс на это

Ожидаемый результат

      array (size=9)
      0 => 
        array (size=2)
          0 => string 'Dog' (length=3)
          1 => string 'http://google.com' (length=17)
      1 => 
        array (size=2)
          0 => string 'German Shepherd' (length=15)
          1 => string 'http://yahoo.com' (length=16)
      2 => 
        array (size=2)
          0 => string 'Belgian Shepherd' (length=16)
          1 => string 'http://duckduckgo.com' (length=21)
          2 => 
            array (size=2)
              0 => string 'Malinois' (length=8)
              1 => string 'http://amazon.com' (length=17)
              2 => 
                array (size=2)
                  0 => string 'Groenendael' (length=11)
                  1 => string 'http://metallica.com' (length=20)
              3 => 
                array (size=2)
                  0 => string 'Tervuren' (length=8)
                  1 => string 'http://microsoft.com' (length=20)
      3 => 
        array (size=2)
          0 => string 'Cat' (length=3)
          1 => string 'http://ibm.com' (length=14)
          2 => 
            array (size=2)
              0 => string 'Siberian' (length=8)
              1 => string 'http://apple.com' (length=16)
          3 => 
            array (size=2)
              0 => string 'Siamese' (length=7)
              1 => string 'http://stackoverflow.com' (length=24)
Author: Chandan Pasunoori, 2014-02-09

1 answers

Это должно сработать. Я предоставил все объяснения в комментариях к коду. Это работает -

    This function takes a strings- $text and $links_text.
    For each text value that matches the regular expression, the link
    from the $links_text is extracted and given as output.
    This returns an array consisting of the text mapped to their links.
    It will return a single array if there only single text value, and 
    a nested array if more than one text is found.
        var_dump(text_link_map("* [Dog][0]", "[0]:(http://google.com)[1]:(http://yahoo.com)"));
          0 => string 'Dog' (length=3)
          1 => string 'http://google.com' (length=17)
function text_link_map($text, $links_text){
    $regex= "/\*\s+\[([a-zA-Z0-9\-\_ ]+)\]\[([0-9]+)\]/";
    if(preg_match_all($regex, $text, $matches)){
        $link_arr = Array();
            For each of those indices, find the appropriate link.
        foreach($matches[2] as $link_index){
            $links = Array();
            $link_regex = "/\[".$link_index."\]\:\((.*?)\)/";
                $link_arr[] = $links[1];
        if(count($matches[1]) == 1){
            return Array($matches[1][0], $link_arr[0]);
            $text_link = array_map(null, $matches[1], $link_arr);
            return $text_link;
        return null;

    Function that calls recursive index, and returns it's output.
    This is is needed to pass initial values to recursive_index.
function indent_text($text_lines, $links){
    $i = 0;
    return recursive_index($i, 0, $text_lines, $links);

    This function creates a nested array out of the $text.
    Each indent is assumed to be a single Tab.It is dictated by the
    $indent_symbol variable.
    This function recursively calls itself when it needs to go from 
    one level to another.
function recursive_index(&$index, $curr_level, $text, $links){
    $indent_symbol = "\t";
    $result = Array();
    while($index < count($text)){
        $line = $text[$index];
        $level = strspn($line, $indent_symbol);
        if($level == $curr_level){
            $result[] = text_link_map($line, $links);
        }elseif($level > $curr_level){
            $result[count($result) - 1][] = recursive_index($index, $curr_level + 1, $text, $links);
            if($index > count($text)){
        }elseif($level < $curr_level){
        $index += 1;
    return $result;

$file_name = "navigationbar.md";
$f_contents = file_get_contents($file_name);
//Separate out the text and links part.
//(Assuming the text and the links will always be separated with 2 \r\n)
list($text, $links) = explode("\r\n\r\n", $f_contents);
//Get the nested array.
$formatted_arr = indent_text(explode("\r\n", $text), $links);

Это выходные данные кода. Это соответствует вашим требованиям -

array(4) {
  array(2) {
    string(3) "Dog"
    string(17) "http://google.com"
  array(2) {
    string(15) "German Shepherd"
    string(16) "http://yahoo.com"
  array(3) {
    string(16) "Belgian Shepherd"
    string(21) "http://duckduckgo.com"
    array(3) {
      array(2) {
        string(8) "Malinois"
        string(17) "http://amazon.com"
      array(2) {
        string(11) "Groenendael"
        string(20) "http://metallica.com"
      array(2) {
        string(8) "Tervuren"
        string(20) "http://microsoft.com"
  array(3) {
    string(3) "Cat"
    string(14) "http://ibm.com"
    array(2) {
      array(2) {
        string(8) "Siberian"
        string(16) "http://apple.com"
      array(2) {
        string(7) "Siamese"
        string(24) "http://stackoverflow.com"

Чтобы проверить, содержимое navigationbar.md является -

Некоторые допущения в коде -

  • Часть, разделяющая текст (т.е. часть "*[Собака][0]") и часть ссылки (т.е. "[0]:(http://google.com )") предполагается, что они всегда разделены на 2 новые строки.
  • Каждый родительский потомок отличается от одной вкладки ("\t").

Вы можете проверить, изменив вкладки между текстом в navigationbar.md .

Надеюсь, это поможет.

Author: Kamehameha, 2014-02-09 19:56:58