Processing Mirandese as Portuguese[eiditar código-fuonte]

There is an error in the configuration of Mirandese-language wiki projects. Text on this wiki is treated as if it is in Portuguese. In general, treating one language as another gives poor results. Sometimes it does nothing, and often it does the wrong thing. However, Mirandese and Portuguese may be similar enough that doing so provides a significant benefit. It is difficult to know without being familiar with both languages. I'm hoping you can give us your opinion. Unless there is a good reason to keep treating Mirandese as Portuguese, the change will begin the week of October 9th. Please let me know of any concerns. You can read more about the overall project (in English) on [1].

Obrigado! TJones (WMF) (cumbersa) 14h39min de 4 de outubre de 2017 (UTC)

Hello Trey Jones, thank you for your answer, I agree about treat one language as another gives poor results, but unfortunately not all the texts of the system are translated into Mirandese language, we're working on it, translating the texts of MediaWiki in Mirandese on I think that the Portuguese is the second language of the system of, because the native speakers of the Mirandese language also know and speak the Portuguese language, in fact even more than their own language, and because of the system is still being translated. The texts and codes of mwl.wikipedia needs update, for example the feminine word of User (Outelizadora) and neutral word (Outelizador(a)) does not appear, and is displayed only the masculine word (Outelizador), and also we do not have yet the namespaces: Book (Lhibro), Education Program (Ansino), TimedText, and the namespace Portal does not appear in Special:AllPages. I also invite the administrator Alchimista to participate in this talk. Greetings from the Mirandese and Portuguese communities. Athena in Wonderland (cumbersa) 21h20min de 4 de outubre de 2017 (UTC)
Hi Athena. Thanks for the quick reply, and thank you for replying in English! I'm sorry that I wasn't clear. We do not want to remove or change the system messages that are in Portuguese. The concern is that the text of articles is processed for searching as if it were Portuguese. So, in the article Porgrama de cumputador, the text, "Un porgrama de cumputador ó porgrama anformático ye ua coleçon de anstruçones que çcriben ua tarefa a ser rializada por un cumputador...." is currently processed by the search engine as Portuguese. It does some things right, and some things wrong. The question is whether Mirandese and Portuguese are close enough to keep processing the text like Portuguese. For example, Portuguese processing discounts um, uma, de, ou, que, and por, but doesn't know to discount un, ua, ó, or la. It doesn't handle d', l', and qu', but neither would turning it off. It does some useful things, like treating porgrama and porgramas the same, so searching for one finds the other. It will handle some inflections but not others. So the question is whether the partial correct processing is worth the inconsistency and possible occasional error. TJones (WMF) (cumbersa) 13h15min de 5 de outubre de 2017 (UTC)
Hi TJones, sorry for the delay to answer. The Mirandese texts in the search engine treated as Portuguese and other Mirandese words that can not be displayed are a problem. What will happen if the processing (like Portuguese) is removed from It would be necessary to create a code or tool for the Mirandese language? And the results would show the texts in Mirandese and with the apostrophe omitted in words? Athena in Wonderland (cumbersa) 17h28min de 9 de outubre de 2017 (UTC)
Hi Athena—without the Portuguese analyzer, would get the "default" analyzer, which is what most wikis have. It does basic processing; for Mirandese text, that would include lowercasing everything and removing punctuation, though it would keep apostrophes in the middle of words. So 'xx, xx', and "xx" would all match xx. x'x would be one word, but would not match xx. x"x would be split into two words. There would be no stop words, so no words would be omitted from being indexed, though the math that does matching does discount the most common words and emphasizes the rarer words.
It's possible to create custom processing for Mirandese, but we don't have the capacity to do it to the same level of detail as Portuguese. However, I could configure some basic processing like stripping d', l', and qu' if I had a full list. I could also probably enable custom stop words if I had a list. Here are lists for Portuguese and English. (Note that | is used as a comment marker, and some words are mentioned but not used.) It's not just a matter of translating the list, but also thinking about similar kinds of words, and whether words have multiple meanings. (So, can in English means both Portuguese poder and lata, but the poder meaning is more common. However, the list I linked to disabled it as a stop word, so that we get better matches on the lata meaning. Similarly for maymaio vs poder again, and others.) I think the English list is more aggressive and from line 207 down adds a lot of other common words. Making an exact list is an art more than a science. Working on such a project would be fun, so I'm up for it, though it wouldn't be my main project, so it would take a few weeks to build and test. TJones (WMF) (cumbersa) 16h23min de 10 de outubre de 2017 (UTC)
These changes were completed the week of October 9th and deployed the following week. The re-indexing of the affected wikis was completed a few hours ago and should be live everywhere now. The list of affected languages is on the Phab ticket T177871 and a list by wiki is on that page in a comment. For more details, see the write up on MediaWiki. TJones (WMF) (cumbersa) 14h54min de 24 de outubre de 2017 (UTC)
Hi TJones, sorry for the delay in answering and for not having reply before, this is a bit complicated for me (because I do not have advanced knowledge in codes). I signed up in GitHub and I created the list of Mirandese stop words to help you, based on the Portuguese list, greetings from the Mirandese and Portuguese communities. Athena in Wonderland (cumbersa) 07h30min de 1 de nobembre de 2017 (UTC)
Hi Athena—this list is great! It may be a while before I can work on it, but I've added a link to your wonderful list to my notes for working on it. I'll be sure to announce any work here and contact you to help test, if you have time. Thanks! TJones (WMF) (cumbersa) 20h09min de 1 de nobembre de 2017 (UTC)
Ok, thank you for your contributions, you can contact me anytime to help, greetings from the Mirandese and Portuguese communities. Athena in Wonderland (cumbersa) 04h38min de 2 de nobembre de 2017 (UTC)

Páigina percipal an stilo nuobo[eiditar código-fuonte]

Olá a todos, venho propor a atualização do layout da Biquipédia:Páigina percipal para este layout, que adaptei das versões lusófona e holandesa. As secções dos portais foram substituídas por categorias, visto que só existem dois portais na Biquipédia mirandesa, e também proponho a fusão da tabela Bienbenido(a) com a da Quemunidade, para poder ajustar melhor à página principal. Convido os editores Dario, Gato Preto, Alchimista e Manuel de Sousa para opinarem, cumprimentos. Athena in Wonderland (cumbersa) 15h13min de 22 de outubre de 2017 (UTC)

Apoio a mudança sugerida pela colega Athenas. Gostei do novo layout ficou melhor. Apoio também a fusão das tuas tabelas. A editora tem colaborado intensamente em melhorar este projeto que estava meio "abandonado". Continue com o excelente trabalho, parabéns! DARIO SEVERI (cumbersa) 16h17min de 22 de outubre de 2017 (UTC)
Também apoio as alterações propostas! Parabéns por apostar também neste projeto! Cumprimentos, Manuel de Sousa (cumbersa) 00h07min de 25 de outubre de 2017 (UTC)
Eu gosto! Acho que é moderno e pode motivar nem que seja visualmente os leitores e, com sorte futuros wikipedistas. É imperioso fazer com que a Wikipédia em mirandês não fique para trás no tempo, hora de marchar! Salve germanos, Gato Preto (cumbersa) 20h23min de 31 de outubre de 2017 (UTC)

Perpuostas i atualizaçones de ls domínios[eiditar código-fuonte]

Olá a todos, venho fazer quatro propostas:

A primeira é sobre os nomes dos domínios (namespaces) da Biquipédia mirandesa que precisam de ser urgentemente atualizados, pois alguns estão em português como: Utilizadora e Módulo Discussão, e outros não existem aqui, como: Portal (ns:100), Lhibro (ns:104), Ansino (ns:446), e TimedText (ns:710). Então proponho a atualização dos nomes e a adição dos domínios que faltam com as seguintes nomenclaturas:

Nota: Coloquei o travessão (—) para indicar que não é necessária a alteração nalguns domínios.

Números Nomes originais em inglês Nomes em português Nomes em mirandês Proposta dos domínios
0 Main Principal Percipal
1 Talk Discussão Cumbersa
2 User Usuário(a) Outelizador(a) Outelizador(a)
3 User talk Usuário(a) Discussão Cumbersa outelizador(a) Cumbersa outelizador(a)
4 Wikipedia Wikipédia Biquipédia
5 Wikipedia talk Wikipédia Discussão Cumbersa Biquipédia Cumbersa Biquipédia
6 File Ficheiro Fexeiro
7 File talk Ficheiro Discussão Cumbersa fexeiro
8 MediaWiki MediaWiki Biqui
9 MediaWiki talk MediaWiki Discussão Cumbersa Biqui
10 Template Predefinição Modelo
11 Template talk Predefinição Discussão Cumbersa modelo Cumbersa modelo
12 Help Ajuda Ajuda
13 Help talk Ajuda Discussão Cumbersa ajuda
14 Category Categoria Catadorie
15 Category talk Categoria Discussão Cumbersa catadorie
100 Portal Portal Portal Portal
101 Portal talk Portal Discussão Cumbersa portal Cumbersa portal
104 Book Livro Lhibro
105 Book talk Livro Discussão Cumbersa lhibro
446 Education Program Ensino Ansino
447 Education Program talk Ensino Discussão Cumbersa ansino
710 TimedText TimedText Legenda
711 TimedText talk TimedText talk Cumbersa legenda
828 Module Módulo Módulo
829 Module talk Módulo Discussão Cumbersa módulo Cumbersa módulo
2300 Gadget Gadget Gadget
2301 Gadget talk Gadget talk Cumbersa gadget Cumbersa gadget
2302 Gadget definition Gadget definition Defeniçon gadget Defeniçon gadget
2303 Gadget definition talk Gadget definition talk Cumbersa defeniçon gadget Cumbersa defeniçon gadget
2600 Topic Tópico Tópico
-1 Special Especial Special
-2 Media Multimédia Multimédia Multimédia

A segunda proposta é adicionar uma ligação da subpágina de testes (/Testes) no cabeçalho ao lado de Discussão, tal como nas versões lusófona e anglófona, que há de ajudar e facilitar a vida de muitos editores.

A terceira proposta é criar os pseudos-domínios BP e WP (ou somente BP) para redirecionarem ao domínio Biquipédia (com base nessa proposta de 2011 da versão lusófona).

A quarta e última proposta é deixar o nome da língua mirandesa em letra minúscula: mirandés (que atualmente está escrito em letras maiúsculas: Mirandés) nas secções languages de todos os projetos Wikimedia, tal como noutras línguas românicas (português, português do Brasil, galego, asturianu, aragonés, español, català, italiano, français e română).

Convido os editores Dario, Gato Preto, Alchimista, Manuel de Sousa, He7d3r e Ishiai para opinarem e todos que quiserem participar desta discussão, cumprimentos e boas edições a todos. Athena in Wonderland (cumbersa) 02h44min de 27 de outubre de 2017 (UTC)

Dei uma olhada na tabela e os nomes que estão propondo em mirandes, eles me parecem corretos, não conheço o idioma em profundidade mas comparando as palavras com outras concordo com a mudança. Quanto as outras 3 propostas ... nada contra, principalmente a quarta que corrige um erro pois este procedimento é utilizado nas línguas românicas. DARIO SEVERI (cumbersa) 04h22min de 27 de outubre de 2017 (UTC)

Como ninguém se opôs, farei o pedido no Phabricator, cumprimentos. Athena in Wonderland (cumbersa) 17h39min de 8 de nobembre de 2017 (UTC)

Nuoba eileiçon de admenistraçon[eiditar código-fuonte]

Oulá a todos, anuncio que abri un pedido de admenistradora, yá que l statuto temporairo de trés meses stá a se spirar, cumprimientos i buonas eidiçones a todos.
Olá a todos, informo-vos que estou recandidatando para administradora, abri um pedido aqui, pois o estatuto temporário de três meses está se expirando, cumprimentos e boas edições a todos. Athena in Wonderland (cumbersa) 20h49min de 23 de nobembre de 2017 (UTC)