Statmanager-kr

Latest version: v1.8.1.15

Safety actively analyzes 687918 Python packages for vulnerabilities to keep your Python projects secure.

Scan your dependencies

Page 7 of 11

1.8.1.1

New function

It is now possible to apply **Yuen's two-sample t-test (Also called as Independent Samples T-test using unequal variance)**.

Read more about it **[here](https://www.notion.so/Yuen-s-two-samples-t-test-Independent-samples-t-test-using-unequal-variance-fa617e58294f4b1cb0bb62d6fc684d83?pvs=21)**.

This t-test is an independent samples t-test that can be utilized when equality of variances is not met.

It can be applied by setting the trim ratio.

The argument to provide to `method` is `ttest_ind_trim`.

Similar to `bootstrap`, the trim ratio can be appended immediately after the argument.

The trim ratio is limited to 0 to 0.5 based on academic recommendations and the capabilities of the dependent library `scipy.stats.ttest_ind()`.

Improvements

Adjustment of `figsize`, `font`, and `font_scale` is now possible via the `.revise()` method, which is used to modify the properties of the graphs/figures produced by the analysis.

Bug Fix

Fixed a bug where `pd.DataFrame`s embedded in the results were not saved properly when saving the output in xlsx format.

Fixed a bug where Linear Regression and Logistic Regression results were not saved properly.

Also, I found and fixed a bug where the dependent variable was not properly dummy-coded when running Multinomial Logistic Regression analysis.

---

추가된 기능

이제 **Yuen’s two-sample t-test**의 적용이 가능합니다. (이는 **Independent samples T-test using unequal variance**로 불리기도 합니다. )

자세한 내용은 **[여기서](https://www.notion.so/Yuen-s-two-samples-t-test-Independent-samples-t-test-using-unequal-variance-966d581c18834da294bd4ced6c0aa7d1?pvs=21)** 확인하세요.

해당 t-test는 등분산성이 충족되지 않은 경우 활용할 수 있는 independent samples t-test입니다.

trim ratio를 설정함으로써 적용이 가능합니다.

`method`에 제공해야할 인자는 `ttest_ind_trim` 입니다.

`bootstrap`과 유사하게 인자 바로 뒤에 trim ratio를 붙여주면 됩니다.

trim ratio는 학계의 권고 및 종속된 라이브러리인 `scipy.stats.ttest_ind()`의 기능에 따라 0 ~ 0.5로 제한됩니다.

개선된 기능

이제 분석 결과를 통해 산출된 그래프/그림의 속성을 수정할 때 사용되는 `.revise()` 메소드를 통해 `figsize`, `font`, `font_scale`의 조정이 가능합니다.

버그 수정

출력된 결과를 xlsx 포맷으로 저장하는 경우 결과에 포함된 `pd.DataFrame`들이 제대로 저장되지 않던 버그를 수정했습니다.

Linear Regression 및 Logistic Regression 결과가 제대로 저장되지 않던 버그를 수정했습니다.

또한, Multinominal Logistic Regression 분석 진행시 종속변수가 제대로 dummy-code되지 않는 버그를 발견하여 수정하였습니다.

1.8.1.0

If it is possible see the original notice **[here](https://www.notion.so/cslee145/ver-1-8-1-0-Will-be-8da34bdaee39446d94aade6a8247823d?pvs=4)**

Dependency

Added a dependency on `XlsxWriter`, this is due to an update to the save functionality.

New functions

The functions of **saving results** are now available. See the details [here](https://www.notion.so/Documentation-74a610c12881402d96dc5d1654f97433?pvs=21). Also, the functions of generating **graphs/figures** are now fully capable to help you **visualize** the results of your analysis.

As with other statistical analyses, graphs can be generated by adjusting the `method` parameter within the `.progress()` method, or by using the newly created function named `.figure()` as a chain method on the results of analyses run through `.progress()` to generate graphs customized to the type of analysis and results.

For example, running `sm.progress(method = 'hist', vars = 'prescore')` draws a histogram.

As another example, running `sm.progress(method = 'kstest', vars = 'age').figure()` outputs a CDF graph along with the results of a Kolmogorov-Smirnov Test analysis.

The output graph has a new method called `.revise()` that allows you to change the title, xlabel, ylabel, xticks, and yticks. We've devoted a new paragraph in the documentation to explaining its usage, so check it out in more detail at **[that link](https://www.notion.so/Documentation-74a610c12881402d96dc5d1654f97433?pvs=21)**.


**Improvements**

A minor bug was found and fixed in `.change_dataframe()`.

Fixed some bugs when applying the `selector` parameter in `.progress()`.

Improved the readability of the dataframes output by some analytics.

Changed features

1. correlation analysis now calculates correlations for each pair of input variables, instead of limiting it to data with no missing values across all input variables. Therefore, the number of n is displayed for each pair.
2. for pearson correlation analysis, the 95% confidence interval is output together.


<hr>

종속성

`XlsxWriter`에 대한 종속성이 추가되었습니다. 저장 기능이 업데이트 되었기 때문입니다.

추가된 기능

이제 분석 결과를 저장하는 기능이 활용 가능합니다. 자세한 내용은 **[여기서](https://www.notion.so/dded43262f784c70a37fddb11ec7c9d1?pvs=21)** 확인하세요.

또한, 분석 결과를 시각화하는 데 유용한 그래프를 산출해내는 기능을 본격적으로 활용 가능합니다.

다른 통계분석을 진행하듯, `.progress()` 메소드 내에서 `method` 파라미터를 조정함으로써 그래프를 산출할 수도 있고, `.progress()`를 통해 진행된 분석 결과에 새로 마련된 `.figure()`를 체인 메소드로 활용함으로써 분석 종류 및 결과에 맞춤화된 그래 산출할 수도 있습니다.

예를 들어, `sm.progress(method = 'hist', vars = 'prescore')`를 실행하면 히스토그램이 그려집니다.

또 다른 예를 들면, `sm.progress(method = 'kstest', vars = 'age').figure()` 를 실행하면 Kolmogorov-Smirnov Test 분석 결과와 함께 CDF 그래프가 함께 출력됩니다.

출력된 그래프는 `.revise()` 라는 새로운 메소드를 통해 제목, xlabel, ylabel, xticks, yticks를 변경할 수 있습니다. 이는 문서 내 새로운 단락을 할애하여 용법을 설명해두었으니, [해당 링크](https://www.notion.so/dded43262f784c70a37fddb11ec7c9d1?pvs=21)에서 좀 더 상세하게 살펴보세요.

1.8.0.0

**General announcement**

I'm planning to update statmanager-kr as a package in earnest, adding more useful features as a tool for conducting research and scientific methods. Before that, I've been working on separating all of them into their own methods, as most of the current features are currently intertwined in one python file, making it difficult to modify and add features. This is finally done, and it's been verified to be bug-free, so more useful features will be added in the future. If you're curious about the changes, check out the Github repository

**Chain-methoding is now possible.**

All additional functions now work with chain methoding. For example, functions like `sm.set_language().progress()` all work fine.

**New** **useful** **additional functionality : `.change_dataframe()`**

Added additional function to change the dataframe of a Stat_Manager object, see the [relevant paragraph in the official documentation](https://www.notion.so/Documentation-74a610c12881402d96dc5d1654f97433?pvs=21) for more details. Basically, it works the same as when you create the object. Naturally, it also works with chain methoding. For example, coding something like `sm.chagne_dataframe().set_language().progress()` will work just fine.

**Fixing bugs in a few analyses**

As I've been working on splitting the code into independent functions for each analysis, I've naturally found bugs in a few analytics. The most serious of which was that f_nway and f_nway_rm were missing parts of the interaction when 3-Way and above. Now, of course, they work as they should. A few other minor bugs have all been fixed as well.

**Renaming some analyses and correcting output metrics**.

I've renamed some of the analyses to avoid misunderstandings. For example, the 3-way repeated measures ANOVA is now called the 3-way Mixed Repeated Measures ANOVA. I've also changed the output to include more metrics for each analysis, following the APA style reporting guide. This will be an ongoing improvement.

**Remove the effectsize parameter in .progress()**

Previously, the effectsize parameter in .progress() during analysis could be used to calculate the effect size. While modifying the code, I realized that this was very user-unfriendly and unnecessary. This parameter has now been removed and each analysis will automatically calculate and output the effect size if possible. This means that the behavior when the effectsize parameter was true is now automatic.

---

**전반적인 공지**

본격적으로 statmanager-kr을 패키지로서 업데이트하고, 연구 및 과학적 방법을 수행하는 도구로서 유용한 기능들을 추가해나가려고 합니다. 그 전에 현재 대부분의 기능이 하나의 python 파일에서 얽혀 돌아가고 있는 점이 수정과 기능 추가를 어렵게 만들고 있었기에, 이들을 모두 각각의 메소드로 구분하는 작업을 진행했습니다. 이제 완료되었고, 버그가 없는 것으로 확인되었으므로 앞으로 더 유용한 기능들이 추가될 예정입니다. 변경사항이 궁금하다면 Github repository를 참고하세요!

**체인 메소드닝이 가능합니다.**

이제 모든 부가 기능은 체인 메소드닝으로 작동합니다. 예를 들어, `sm.set_language().progress()` 와 같은 기능이 모두 정상적으로 작동합니다.

**유용한** **부가 기능 추가 : `.change_dataframe()`**

Stat_Manager 객체의 데이터프레임을 변경할 수 있는 부가 기능이 추가되었습니다. 자세한 내용은 [공식 문서의 관련 단락](https://www.notion.so/dded43262f784c70a37fddb11ec7c9d1?pvs=21)에서 확인하시기 바랍니다. 기본적으로 객체를 생성할 때와 동일한 기능으로 작동합니다. 당연히, 이 또한 체인 메소드닝으로 작동합니다. 예를 들면, `sm.chagne_dataframe().set_language().progress()` 이런 식으로 코딩해도 문제없이 동작합니다.

**몇몇 분석에서 발견된 버그 수정**

분석 기능별 독립적인 기능으로 코드를 분할하는 작업을 수행하면서 자연스럽게 몇몇 분석에서 버그를 발견할 수 있었습니다. 그 중 가장 심각한 것은 f_nway 및 f_nway_rm에서 3-Way 이상인 경우 상호작용의 일부가 누락되는 현상이었습니다. 이제 당연히 정상적으로 작동합니다. 몇몇 소소한 버그들도 모두 수정되었습니다.

**분석 이름 재정립 및 출력되는 지표 수정**

몇몇 분석의 명칭이 오해를 방지하기 위해 수정되었습니다. 예를 들면, 3-way repeated measures ANOVA의 정확한 명칭은 3-way Mixed Repeated Measures ANOVA입니다. 또한, APA style의 reporting 가이드를 참고하여 각 분석별로 필요한 지표를 더욱 풍부하게 출력하도록 변경하였습니다.

**.progress()의 effectsize 파라미터 삭제**

기존에는 분석을 진행하는 .progress()에서 effectsize 파라미터를 활용해 효과크기를 산출할 수 있었습니다. 코드를 수정하던 중 이러한 기능이 굉장히 사용자에게 친화적이지 않고 불필요하다는 것을 깨달았습니다. 이제 이 파라미터는 삭제되었고 각 분석에서는 가능한 경우 자동으로 효과크기가 계산되어 출력됩니다.

1.7.2.6

1. Bootstrap 관련 기능 개선 및 버그 수정

Bootstrap percentile method의 resampling 횟수를 자유롭게 조절할 수 있습니다.

이제 .progress()에서 method = 'bootstrap리샘플할횟수' 를 입력하면 됩니다.

(예. sm.progress(method = 'bootstrap8000', vars = ['prescore', 'postscore']) — 8000번의 리샘플링)

Bootstrap된 데이터프레임을 반환하고자 하는 경우 method에 _df를 붙이면 됩니다.

(예. sm.progress(method = 'bootstrap8000_df', vars = ['prescore', 'postscore']) — 8000번의 리샘플링)

또한, bootstrap percentile method 및 bootstrap 데이터프레임 반환을 위해 .progress() 메소드를 활용할 때, group_names를 지정하지 않으면 작동되지 않던 오류를 수정했습니다.


1. 크론바흐의 알파 계산 기능 추가

이제 크론바흐의 알파를 계산할 수 있습니다. 적용 방법은 아래와 같습니다.
sm.progress(method = 'cronbach', vars = ['item1', 'item2' , ..., ])

곧 documentation에 관련 내용이 추가될 예정입니다.

2. Figure 및 Graph 생성 기능 추가 (임시 구현)

이제 Figure 및 Graph를 생성하는 기능이 추가될 예정입니다.

현재는 임시로 pp-plot과 qq-plot 을 생성하는 기능을 추가했습니다.

곧 documentation에 관련 내용이 추가될 예정입니다.

예시. sm.progress(method = 'pp_plot', vars = 'prescore')

예시. sm.progress(method = 'qq_plot', vars = 'prescore')


---

1. Improvement in bootstrap related functions and bug fix

You can now freely adjust the number of resampling times for the Bootstrap percentile method.

In `.progress()` , `method = 'bootstrap{resamplingtime}'` .

(Example. `sm.progress(method = 'bootstrap8000', vars = ['prescore', 'postscore'])` — Resampling no. = 8,000)

If you want to return a bootstrapped dataframe, you can append _df to method.

(Example. `sm.progress(method = 'bootstrap8000', vars = ['prescore', 'postscore'])` — Resampling no. = 8,000)

Also, errors that occured if group_names were not specified in bootstrap percentile method or bootstrap returning were fixed


1. Add function : calculating cronbach’s alpha

See the example below:
`sm.progress(method = 'cronbach', vars = ['item1', 'item2' , ..., ])`

I'll be adding this to the documentation soon.

2. Add function (Temporary) : Making figures or graphs for statistic

For now, it is possible to make p-p plot or q-q plot like this :

ex. `sm.progress(method = 'pp_plot', vars = 'prescore')`

ex. `sm.progress(method = 'qq_plot', vars = 'prescore')`

I'll be adding this to the documentation soon.

1.7.2.5

Fixed bug caused when selector parameter were used in `.progress()`

---

`.progress()` 에서 selector 파라미터를 사용할 경우 발생하는 버그가 발견되어 수정, 재배포됐습니다.

1.7.2.4

1. Fixed a typo in the documentation link in the package
2. Modified menu_for_howtouse.py with dataframes to be associated with a .csv file for ease of modification.
3. Fixed a bug (Changing the language via set_language() caused an error in howtouse(). )
4. Fixed a typo in several reporting sentences

Page 7 of 11

© 2024 Safety CLI Cybersecurity Inc. All Rights Reserved.